전체 글

전체 글

    [시계열] Time Series Regression - Part 2

    [시계열] Time Series Regression - Part 2

    본 강의노트는 김성범 교수님의 Time Series Regression - Part2를 바탕으로 작성했음을 밝힙니다. Review - 시계열 데이터 구성요소 위의 그림을 보면, Trend, Seasonal variations, Random fluctuation이 나타남을 볼 수 있다. Time Series Analysis 시계열 회귀분석 지수 평활법 박스-젠킨스 시계열 분석법 다양한 머신러닝 방법(Hidden Markov, DNN ...) Time Series Regression Models(시계열 회귀분석) t 시점에서의 종속변수(주로 y)에 대한 독립변수(주로 x)의 선형결합 $y_t = TR_t + ε_t$ $y_t$ = the value of time series $TR_t$ = the trend..

    [Classification] Naver Movie Review Sentiment Classification Using Setencepiece

    프로젝트 Github: https://github.com/vg-rlo/aiffel-nlp-projects/tree/master/SetencePiece 네이버 영화 리뷰 감정 분류기 네이버 영화 리뷰 데이터를 바탕으로 긍정/부정으로 감정 분류를 하는 프로젝트입니다. 이전에는 단순히 Mecab과 같은 라이브러리를 활용해서 분류모델의 입력 데이터를 위한 토크나이징을 진행했습니다. 이번에는 Setencepiece를 활용해서 품사 태깅 데이터를 기반으로 토크나이저를 학습하고 저희 학습데이터에 부가적인 전처리 없이 분류 모델을 학습시켰습니다. Tokenizer Tokenizer의 종류 공백 기반: split 함수 형태소 기반: Konlpy(Mecab, Okt) 등.. Subword 기반: Sentencepiece ..

    [Python] TypeError: object of type 'float' has no len()

    [Python] TypeError: object of type 'float' has no len()

    Error TypeError: object of type 'float' has no len() 해당 에러 메세지는 List값에 len로 읽기 어려운 float, int형이 들어가있으면 발생하는 오류입니다. Solution dataframe내에는 여러 Type이 들어있을 수 있기 때문에 이러한 내장함수 len을 쓰기 전에 null처리 등을 진행한 후에 실행해야 오류가 사라집니다. 아래와 같은 enumerate로 리스트나, dataframe의 특정 컬럼의 값을 확인해보면서 오류가 나는 지점의 데이터를 확인 후에 변경해줍니다. for i, s in enumerate(train_data['document']): print(i, ": ", len(s)) 아래와 같은 방식으로 오류가 나는 지점을 확인할 수 있었습니다.

    [DreamAI] 꿈꾸는 아이 경진대회 참여 후기

    [DreamAI] 꿈꾸는 아이 경진대회 참여 후기

    꿈꾸는 아이 경진대회 공식 홈페이지: https://dreamai.kr/ KISTI에서 빅데이터 전문가 양성과정을 수강할 때까지는 AI 쪽에 관심이 없었습니다. 원래 공기업을 준비했었기 때문에 월에 나오는 100만원을 취업 준비 생활비로 쓰기 위해 수강했었습니다. 수료하고 10월부터 가짜연구소 스터디에 우연히 참여하게 되면서 딥러닝에 관심이 생기기 시작했습니다. 꿈꾸는 아이 경진대회 같은 경우 이미지 분류기를 기반으로 진행되는 경진대회였기 때문에 초보자인 저도 참여해볼만하다고 생각되어 같이 KISTI 교육을 들었던 교육생 분들과 팀을 꾸렸습니다. 😀 경진대회 문제 드론을 조종하여 카메라로 인식한 사물을 GUI의 정확한 위치에 찍도록 하는 미션입니다. 제공되는 환경은 아래와 같습니다. intel사의 NUC..

    [Leetcode] Two Sum

    문제 https://leetcode.com/problems/two-sum/ Given an array of integers nums and an integer target, return indices of the two numbers such that they add up to target. You may assume that each input would have exactly one solution, and you may not use the same element twice. You can return the answer in any order. Example 1: Input: nums = [2,7,11,15], target = 9 Output: [0,1] Output: Because nums[0]..

    [Linux] 명령어 정리

    cd: change directory, 디렉토리/파일 접근 wget: web get, 웹상의 파일 다운로드 conda activate: 아나콘다 가상환경을 활성화(켜기) conda create: 아나콘다 가상환경 생성 -n: --no-update, 추가 후 패키지 캐시를 업데이트 하지 않음 -y: --yes, 모든 질의에 동의 -c: ?? -m: --massive-debug, 명령줄에 많은 디버그 정보 출력 -k: --keyserver=KEYSERVER, 레거시 옵션, 사용하지 않음 conda install: 아나콘다 가상환경에 패키지 설치 conda-forge: 설치하고자 하는 패키지의 안정적인 버전 선택 echo: 인수로 전달되는 텍스트를 출력하는 명령어, 쉘 프로그램의 수행 중간 진행상황 체크나, ..

    [Github] White arrow on directory icon

    참고 블로그 https://stackoverflow.com/questions/62056294/github-folders-have-a-white-arrow-on-them stackoverflow.com/questions/21381530/cannot-remove-submodule-from-git-repo Problem Github의 레퍼지토리 폴더 아이콘에 흰색 화살표가 뜨고, 클릭이 되지 않는 현상 Solution cash clear git rm --cached 하위폴더 git commit -m "remove sub entry" git push origin master

    [Tistory] 본문 영역을 벗어나는 글자가 있을 때

    [Tistory] 본문 영역을 벗어나는 글자가 있을 때

    Error Tistory를 사용하다보면 글이나 링크(url)가 본문 영역을 벗어나는 현상을 접하게 됩니다. 본문 영역을 너무 벗어나버리는... 링크.. Solution 티스토리 관리 화면에서 스킨 편집 메뉴를 선택합니다. 우측 상단의 html 편집을 선택합니다. CSS를 우측 상단 카테고리 중에서 선택합니다. (디자인적인 측면을 고려할때는 CSS!) 본문 그리드를 벗어나지 않고 싶은 대상에 아래와 같은 구문을 추가합니다. word-wrap:break-word; 해당 부분은 사용하는 스킨마다 차이가 있습니다. Poster 스킨을 사용 중이기 때문에 Entry Content에서 link가 사용하는 a에 아래와 같은 구문을 추가했습니다. 해결!