DATA

    [Topic Modeling] LSA(잠재 의미 분석)

    해당 글은 아래의 위키독스를 기반으로 학습 후, 요약정리한 내용입니다. 딥러닝을 이용한 자연어 처리 입문 - https://wikidocs.net/24949 LSA(잠재 의미 분석) BoW에 기반한 DTM이나 DTM의 단점을 보완하여 단어의 중요도에 따라 가중치를 부여한 TF-IDF는 기본적으로 단어의 빈도 수를 이용한 수치화 방법이기 때문에 단어의 의미를 고려하지 못한다는 단점이 있습니다. LSA는 BoW에 기반한 알고리즘의 한계점을 보완하는 대안으로 제시되었습니다. LSA를 이해하기 위해서는 아래의 수학적인 개념을 이해해야 합니다. 특이값 분해(SVD, Singular Value Decomposition) 절단된 특이값 분해(Truncated SVD) 특이값 분해(SVD, Singular Value ..

    [Topic Classification] 명사 추출

    보호되어 있는 글입니다.

    [그로스해킹] Session

    구글 애널리틱스 공식 설명: https://support.google.com/analytics/answer/2731565?hl=ko#zippy=%2C%EC%9D%B4-%EB%8F%84%EC%9B%80%EB%A7%90%EC%97%90-%EB%82%98%EC%99%80-%EC%9E%88%EB%8A%94-%EB%82%B4%EC%9A%A9%EC%9D%80-%EB%8B%A4%EC%9D%8C%EA%B3%BC-%EA%B0%99%EC%8A%B5%EB%8B%88%EB%8B%A4 참고 유투브 - Chapter 08. 구글 애널리틱스 세션 지표: https://www.youtube.com/watch?v=r2NC347kK7k 참고 블로그 - GA 세션 지표, 제대로 알고 씁시다: https://brunch.co.kr/@ent..

    [그로스해킹] Funnel 분석

    참고 자료: https://youtu.be/vyYFU-B1X24 Funnel 분석이 왜 필요한가? 고객의 행동 패턴 분석을 위해서 Funnel 분석이란? Funnel은 깔때기처럼 역삼각형으로 많은 유저가 서비스에 접근하는 시점부터 이탈한 고객들이 생기면서 점점 좁아지는 고객층까지의 프로세스를 보는 방법입니다. 즉, 유저들이 들어온 시점부터 설정한 목표를 달성할 때까지 단계별 프로세스를 분석하는 방법입니다. Awareness Interest Decision Action Funnel 분석의 3요소 측정하려는 목표 설정: 꼭 목표가 구매만 되는 건 아닙니다. 목표까지의 단계 설정 데이터 트레킹 툴 연동 Funnel로 목표 달성하는 방법 이탈률/전환율 유입을 폭발적으로 늘립니다. 전환율을 개선합니다. (주로 많..

    [개발환경] 왜 GPU를 사용하는지?

    왜 GPU를 사용하는지? GPU는 ALU를 여러개 가지고 연산을 한번에 처리할 수 있다. throughput(jobs/hour)가 높다 = 병렬연산(동시연산) 컴퓨터 하드웨어는 전력효율을 높이는 것이 중요하다. CPU는 전력 효율을 높이기 위해 latency(지연)을 줄이는 반면, GPU는 전력 효율을 높이기 위해 throughput을 늘린다. CPU는 다음 일을 빠르게, GPU는 한번에 많은 일을 해낼 수 있는 것이다. 참고 블로그: CPU와 GPU의 차이 (tistory.com)

    [확률및통계] 강의 정리

    확률 및 통계를 공부하기 위해 이상화 교수님의 2014-1 확률및통계 강의를 들으며 스터디를 참여했습니다. 스터디 Github - https://github.com/vg-rlo/probability-statistics-study GitHub - vg-rlo/probability-statistics-study: 기초확률통계스터디 기초확률통계스터디. Contribute to vg-rlo/probability-statistics-study development by creating an account on GitHub. github.com 강의노트 Gdrive - https://drive.google.com/drive/folders/1NybAUEEni5Zx9kHdNpRQE9oQUmAg9crD?usp=sharing

    [시계열] Exponential Smoothing (지수 평활법)

    해당 강의노트는 김성범 교수님의 Exponential Smoothing (지수 평활법) 강의를 기반으로 작성했음을 밝힙니다. 구간 평균법 $L_t = {D_t + D_(t-1) + ... + D_(t-N+1)}/N$ 과거 시점의 일정기간의 평균(단순 평균)으로 다음 시점을 예측 구간 평균법이 적절한 case Trend나 Seasonality variables과 같은 일정 패턴없이 변하는 level을 가진 데이터 (질문) 일정 패턴없이 변하는 level이 cycle인지 아니면 random한건지? 어떤 case를 의미하는 것인지 궁금 구간 평균법의 한계 과거 n개의 데이터에 동일한 가중치를 준다. 예시: 현재 시점 t를 기준으로 n=3까지의 과거 데이터를 고려한다고 가정해보자. 구간평균법은 t, t-1, t..

    [시계열] Time Series Regression - Part 3

    본 강의노트는 김성범 교수님의 Time Series Regression - Part 3를 바탕으로 작성했음을 밝힙니다. Modeling Seasonal Variations Using Binary variables Binary variables: 0 아니면 1의 값을 가지는 변수 Example - Modeling Seasonal Variations Using Binary variables 14년: 1년이 12개월이므로 t는 1~168 Increasing Seasonal ⇒ log 변환 필요, 복원해줄땐 exlog 변환 필요 이를, 모델링할 수 있는 형태로 바꾼다면? 최소제곱법을 사용한 다중회귀모델 여기서, Binary variable은 M에 해당한다. Trend성분은 Linear한 B1, B2까지만 해당한..