728x90
df
다음과 같이 data가 들어있을 때 이것 전체를 str로 보기 때문에 리스트 형태로 변환해서 사용해야 함
import ast
emojif['processed_text_v2'] = emojif['processed_text_v2'].apply(ast.literal_eval)
위의 코드를 사용하면 리스트로 변환이 가능함
각 data가 " "로 둘러싸여 있지 않다면 re를 활용하여 변경이 가능
import pandas as pd
import re
data = {'column_name': ["[기타, 기타, 웃는얼굴, 기타, 기타, 상메달, 기타, 기타]"]}
df = pd.DataFrame(data)
def extract_list_from_string(input_string):
return re.findall(r'\b\w+\b', input_string)
df['new_column'] = df['column_name'].apply(extract_list_from_string)
result_list = df['new_column'].tolist()
print(result_list)
print(type(result_list))
Str -> list
import re
input_string = "[기타, 기타, 웃는얼굴, 기타, 기타, 상메달, 기타, 기타]"
result_list = re.findall(r'\b\w+\b', input_string)
print(result_list)
728x90
'Python > 이론, 기초' 카테고리의 다른 글
pandas, github에 있는 데이터 파일 가져오기 (0) | 2024.04.08 |
---|---|
[Python] 파이썬 단계적 함수, 함수 안에 함수 선언 (0) | 2023.05.04 |
[Python] defaultdict, dict의 자료형을 알고 있을 때 자동으로 생성 (0) | 2023.05.04 |
[Python] 리스트에서 원하는 원소 추출, 리스트 필터링 (0) | 2023.05.02 |
[Python] map에서 lambda 쓰기 (0) | 2023.05.01 |