목록분류 전체보기 (258)
Joonas' Note
아래 이미지에서 빨간색 점이 마우스 클릭 위치이다.출처: https://stackoverflow.com/questions/6073505/what-is-the-difference-between-screenx-y-clientx-y-and-pagex-y
최근 회사에서 우분투로 프로젝트를 빌드해야하는 일이 생겼는데, 파일 시스템과 관련하여 학부생때 공부했던 이론이 문제 해결에 도움이 된 경험이 신기해서 글로 남겨본다.이론과 실습, 특히나 다양한 프로그램을 주로 사용하는 우분투 환경에서는 OS, 컴퓨터 구조와 같은 수업에서 배우는 이론적인 부분은 실제 개발하는 중에 크게 마주할 일이 없을거라고 생각했다. 하지만 그런 일이 생겼다.발단동료의 컴퓨터에서 빌드 도중 No space left on device 와 같은 이유로 빌드가 중단되었다. 하지만 디스크 용량을 확인해봤을때, 용량은 분명 40GB 정도 남아있었다. (아래는 당시 상황을 재연한 모습이다.)$ df -hFilesystem Size Used Avail Use% Mounted on/dev/..
Java에서 클래스 간의 상속 관계를 확인할 때 instanceof 키워드를 사용하고 있는데, 간혹 사용하게 된다.사용 빈도가 낮다보니 오랜만에 사용하면 코드 결과에 확신이 없다.분명 맞을텐데 싶으면서도 아닐까 하는 걱정이 생긴다.참고로 이 키워드는 인터페이스에도 사용할 수 있다. 그래서 클래스 상속과 인터페이스 구현 케이스를 정리해보았다.클래스와 인터페이스 정의인터페이스 IA, IB, IC 와 클래스 A, B, C를 아래와 같이 작성했다.interface IA { void fa();}interface IB { void fb();}interface IC { void fc();} abstract class A implements IA { public A() {} @Ove..
평소처럼 git 사용하다가 push 하려는 데 오류가 났다.$ git pushEnumerating objects: 34, done.Counting objects: 100% (34/34), done.Delta compression using up to 8 threadsCompressing objects: 100% (20/20), done.Writing objects: 100% (22/22), 722.07 KiB | 9.89 MiB/s, done.Total 22 (delta 10), reused 6 (delta 1), pack-reused 0error: RPC failed; curl 55 Send failure: Connection was abortedsend-pack: unexpected disconnec..
먼저 Quick, Draw! 는 구글에서 위와 같은 낙서 데이터 셋을 학습하여 345개의 주제 중 하나를 그리면 머신 러닝 모델을 통해 정답을 맞추는 게임이다. 그리고 이 데이터셋을 오픈소스로 공유했다.목표 설정시계열 데이터를 Online 으로 처리하는 RNN 모델을 다루고 싶었고 최종적으로는 브라우저에서 돌아가도록 포팅하는 것이 목표였으나, 아래 서술될 이유로 개발 방향을 잠시 수정하였다.345개의 클래스로 적지 않은 클래스를 분류하는 모델이지만 각 클래스당 최소 1만개 이상의 Dataset이 있으므로 학습에는 어려움이 없을 것이라고 판단하였다.목표 수정간단한 RNN 모델을 만들었는데 학습이 잘 되지 않았었고, 이를 해결하는 과정에서 RNN 구조의 문제인지 데이터 전처리의 문제인지 파악하기가 어려워, ..
문제 git push 를 하다보면 아래와 같이 RPC failed 를 이유로 실패하는 경우가 있다. $ git push origin Enumerating objects: 23, done. Counting objects: 100% (23/23), done. Delta compression using up to 10 threads Compressing objects: 100% (20/20), done. error: RPC failed; HTTP 400 curl 18 HTTP/2 stream 7 was reset send-pack: unexpected disconnect while reading sideband packet Writing objects: 100% (20/20), 342.08 MiB | 21.3..
한국 노래 가사(1964~2023년) 데이터 분석해보기 배경 노래를 꽤 다양하게 듣는 편인데 최근 한국 노래들에 이지리스닝류가 많아지기도 했고, 한국어 가사의 비중이 점점 줄어들고 있는 등 한국 노래 가사의 트렌드가 궁금해져서 한번 데이터 blog.joonas.io 오랜 시간에 걸쳐서 음원 스트리밍 플랫폼에 추천이 많이 도입되었다. 특정 노래를 기반으로 추천하는 건 아주 오래 전부터 이미 있었지만 (최소 2010년 iTunes 부터), 근래에는 주제/테마별로 묶은 플레이리스트를 추천하기도 한다. 정밀한 그룹화를 하려면 음원의 특성(파형, bpm, 장르, 가수, 연도 등)까지도 고려해야겠지만, 이번에는 자연어 처리에 집중하고 싶은 만큼 가사 내용을 토대로 주제별로 나눌 수 있는 지 확인해보고자 한다. 데이..
배경 미디엄 블로그를 보다보면 아래와 같이 예상 읽기 시간이 나온다. 예전에 사람이 글을 읽는 데 걸리는 평균 시간을 알아본 적이 있다. WPM(Words per minute) 라고 부르는 단위도 있어서 이미 연구가 있었던 듯 하다. 아래와 같이 여러 나라에 대해서 WPM을 계산한 연구도 있지만 한글은 빠져있다. 한글을 제외하면 평균적으로 190~200 WPM 정도의 속도이다. TimeToRead | Wolfram Function Repository Function Repository Resource: TimeToRead resources.wolframcloud.com 그래서 한글에 대한 WPM을 찾아보다가 120 정도라는 글을 찾았고 한글과 영문의 분포에 따라 적절히 계산하기로 했다. 영어의 경우에는 ..