728x90
아래의 github에 있는 tsv(또는 csv) 파일을 가져올 것이다.
위의 파일을 눌러서 들어와서 Raw 버튼을 누른다.
"https://raw.githubusercontent.com/google-research/google-research/master/goemotions/data/train.tsv"
위의 주소를 그대로 복사하여 아래 코드에 넣는다.
ParserError: Error tokenizing data. C error: Expected 2 fields in line 12, saw 4
ParserError: Error tokenizing data. C error: Expected 2 fields in line 12, saw 4
위와 같은 에러가 떠서 sep='\n'을 추가하여 해결
df=pd.read_csv("https://raw.githubusercontent.com/google-research/google-research/master/goemotions/data/train.tsv", sep='\t')
df.columns = ["text", "label","eecwqtt"]
df.head(10)
728x90
'Python > 이론, 기초' 카테고리의 다른 글
리스트형태의 문자열을 리스트로 만들기 (0) | 2024.01.16 |
---|---|
[Python] 파이썬 단계적 함수, 함수 안에 함수 선언 (0) | 2023.05.04 |
[Python] defaultdict, dict의 자료형을 알고 있을 때 자동으로 생성 (0) | 2023.05.04 |
[Python] 리스트에서 원하는 원소 추출, 리스트 필터링 (0) | 2023.05.02 |
[Python] map에서 lambda 쓰기 (0) | 2023.05.01 |