'분류 전체보기' 카테고리의 글 목록 — 뚝딱이

분류 전체보기

Machine Learning/이론

f1-score 매개변수 average의 종류

scikit-learn에서는 matrix 계산을 위해 f1-score를 제공한다.from sklearn import metricsf1_score = metrics.f1_score(targets, pred, average='') Sklearn 문서에 의하면 각 정의는 다음과 같다. macro average - averaging the unweighted mean per label( label별 산술 평균값)모든 F1를 평균 낸 것weighted average - averaging the support-weighted mean per label (label 별 샘플 수의 비중 가중 평균값)label의 개수에 따라 가중치를 부여한 것micro average - averaging the total true po..

ERROR

[chrome drive]AttributeError: 'str' object has no attribute 'capabilities'

driver_path = 'D:\program\chromedriver-win64\chromedriver_125'driver = webdriver.Chrome(driver_path) 위의 코드에서 에러가 발생 driver = webdriver.Chrome()selenium이 업데이트 되어서 이제 chrome drive 없이 사용이 가능하다!

기타/etc

VScode C++ 환경 구성하기

vscode에서 C++을 사용하기 위해서는 별도의 조치가 필요하다.1. MSYS2 설치https://www.msys2.org/ MSYS2Software Distribution and Building Platform for Windowswww.msys2.org설치 후 MSYS2 MSYS를 실행한다.2. 명령어 pacman -Syny를 누르다 보면 터미널이 종료되고  다시 MSYS2를 실행한다. pacman -Supacman -S --needed base-devel mingw-w64-x86_64-toolchain mingw64안에 여러 컴파일러들이 들어있는데 나는 그냥 엔터를 눌러 다 설치하였다.3. 환경 변수 설정 Path > 새로 만들기로 들어가 아래의 주소를 추가한다.(주소를 변경했다면 변경한 주소를 ..

기타/etc

윈도우 + shift + s, 윈도우 캡쳐시 화면이 밝아지는 문제 해결

모니터를 바꾼 후로 화면 캡처할 때마다 밝게 변한다...! 밝아져서 글씨도 깨짐..시스템 > 디스플레이에 들어가서 HDR 사용을 "끔"으로 바꾸면 다시 원래대로 돌아온다.

Python/이론, 기초

pandas, github에 있는 데이터 파일 가져오기

아래의 github에 있는 tsv(또는 csv) 파일을 가져올 것이다. 위의 파일을 눌러서 들어와서 Raw 버튼을 누른다. "https://raw.githubusercontent.com/google-research/google-research/master/goemotions/data/train.tsv" 위의 주소를 그대로 복사하여 아래 코드에 넣는다. ParserError: Error tokenizing data. C error: Expected 2 fields in line 12, saw 4 ParserError: Error tokenizing data. C error: Expected 2 fields in line 12, saw 4 위와 같은 에러가 떠서 sep='\n'을 추가하여 해결 df=pd.r..

Python/numpy & Pytorch

csv 파일 json으로 바꾸기

csv 파일을 json으로 바꿔야 하는 상황이 생겨서 변경하고자 한다. import csv import json import pandas as pd csv_file_path = '파일 경로' data = df_tweet = pd.read_csv(csv_file_path) data with open(csv_file_path, 'r', encoding='utf-8') as f: reader = csv.reader(f) next(reader) # 첫 줄 skip # 각 라인마다 딕셔너리 생성 후 리스트에 추가 data = [] for line in reader: d = { 'Topic': line[0], 'Sentiment': line[1], 'TweetId': int(line[2]), 'TweetDate':..

기타/etc

github 코드 가져오는 방법 (Clone)

Vscode Vscode에 들어가서 "F1"을 눌려서 git clone을 검색한다. 그 후에 git 주소를 넣어주면 된다. git 주소는 아래와 같이 copy 할 수 있음 그 후 다운할 위치를 지정하고 select as Repository Destination을 누르면 끝난다. 로컬디스크 다운 할 위치로 가서 open Git Bash here을 누른다. git clone

Machine Learning/기법

Apriori 이란? - 장바구니, 연관성 분석

https://pasongsong.tistory.com/537 Association Rule 연관 규칙 Association Rule 추천 시스템에서 Baseline이 되는 것으로 어떤 사건이 얼마나 자주 함께 발생하는 지를 수치화 하는 방법이다. items 사이의 관계를 수치화 하는 방법으로 items끼리의 상호 연관관계를 pasongsong.tistory.com Association Rule을 적용하기 위해서는 각 item이 item Set에서 어떤 빈도로 출현했는지, 어떤 item과 함께 나왔는지 파악 해야 한다. Dataset의 모든 후보 itemset에 대해 하나하나 검사하는 것은 굉장히 비효율적이며 시간이 오래 걸린다. 이러한 문제를 해결하기 위해 Apriorim, FP-Growth Algor..

파송송
'분류 전체보기' 카테고리의 글 목록