'Python/이론, 기초' 카테고리의 글 목록 — 뚝딱이

Python/이론, 기초

Python/이론, 기초

pandas, github에 있는 데이터 파일 가져오기

아래의 github에 있는 tsv(또는 csv) 파일을 가져올 것이다. 위의 파일을 눌러서 들어와서 Raw 버튼을 누른다. "https://raw.githubusercontent.com/google-research/google-research/master/goemotions/data/train.tsv" 위의 주소를 그대로 복사하여 아래 코드에 넣는다. ParserError: Error tokenizing data. C error: Expected 2 fields in line 12, saw 4 ParserError: Error tokenizing data. C error: Expected 2 fields in line 12, saw 4 위와 같은 에러가 떠서 sep='\n'을 추가하여 해결 df=pd.r..

Python/이론, 기초

리스트형태의 문자열을 리스트로 만들기

df 다음과 같이 data가 들어있을 때 이것 전체를 str로 보기 때문에 리스트 형태로 변환해서 사용해야 함 import ast emojif['processed_text_v2'] = emojif['processed_text_v2'].apply(ast.literal_eval) 위의 코드를 사용하면 리스트로 변환이 가능함 각 data가 " "로 둘러싸여 있지 않다면 re를 활용하여 변경이 가능 import pandas as pd import re data = {'column_name': ["[기타, 기타, 웃는얼굴, 기타, 기타, 상메달, 기타, 기타]"]} df = pd.DataFrame(data) def extract_list_from_string(input_string): return re.finda..

Python/이론, 기초

[Python] 파이썬 단계적 함수, 함수 안에 함수 선언

함수 선언 함수 안에 함수를 선언하는 방법은 그냥 안에 선언해 주면 된다. def 함수이름1(): 코드 def 함수이름2(): 코드 def add_num(): a = 1 b = 2 def add(): return a+b print(add_num()) print(add()) # 에러 발생 None def add_num(): a = 1 b = 2 def add(): return a+b return add() print(add_num()) 3 add 함수는 add_num 안에 있기 때문에 직접적으로 접근하지 못하고 add_num()을 통해 접근해야 한다. 지역 변수 각 함수의 지역 변수 접근 범위는 아래와 같다. add는 add_num의 변수에 접근할 수 있지만 add_num은 add의 변수에 접근할 수 없다..

Python/이론, 기초

[Python] defaultdict, dict의 자료형을 알고 있을 때 자동으로 생성

defaultdict(자료형) defaultdict은 딕셔너리를 만들 수 있는 dict의 서브클래스로 자료형을 기본값으로 dict 객체를 생성한다. 자료형에는 int, float, list, set 등 다양한 값이 들어갈 수 있음 외부함수이기 때문에 import해서 사용함 from collections import defaultdict key = ['a', 'b', 'c', 'd'] int_d = defaultdict(int) for k in key: int_d[k] print(int_d) defaultdict(, {'a': 0, 'b': 0, 'c': 0, 'd': 0}) from collections import defaultdict key = ['a', 'b', 'c', 'd'] int_d = de..

Python/이론, 기초

[Python] 리스트에서 원하는 원소 추출, 리스트 필터링

filter(함수, list) 리스트에서 특정 조건을 만족하는 원소를 추출할 때 쓰인다. a = [1, 2, 3, 4, 5, 6, 7] def isEvenNumber(x): return x % 2 == 0 print(list(filter(isEvenNumber, a))) [2, 4, 6] 굳이 함수를 만들지 않고 lambda를 사용해서 필터링할 수 있다. a = [1, 2, 3, 4, 5, 6, 7] print(list(filter(lambda x: x%2 == 0, a))) [2, 4, 6] list를 사용한 이유는 filter return type이 iterable이기 때문 Comprehension list의 comprehension을 사용하면 해당 list의 원소를 변환할 수 있다. a = [1, ..

Python/이론, 기초

[Python] map에서 lambda 쓰기

lambda는 다양한 함수에서 쓸 수 있는데 sort에서만 쓰다가 map에서 쓰는 법도 기록하려고 한다! map(함수, 입력) map은 입력 리스트를 함수와 같게 바꿀 수 있으며 나는 보통 map(int, list)과 같은 형태로 입력값을 한 번에 int로 바꾸는 방법으로 주로 사용했다. 제곱 아래의 코드 함수 부분에 제곱식을 넣어 list의 값을 제곱수로 바꿀 수 있다. def calc(x): return x*x print(list(map(calc, range(1,6)))) [1, 4, 9, 16, 25] Lambda 위와 같이 함수를 넣어도 되지만 일회용으로만 사용할 함수의 경우 lambda로 작성하여 함수부분에 넣을 수 있다. print(list(map(lambda x: x*x, range(1,6)..

Python/이론, 기초

[Python] 딕셔너리 정렬하기

Key 기준 정렬 오름차순 dict은 list와 같이 .sort 메소드를 가지고 있지 않아 sorted()를 사용하여 정렬하며 key를 기준으로 정렬된다. .items를 쓰지 않으면 정렬된 key만 list로 출력된다. d = dict(a=3, c=7, b=2, d=1) print(d) s_d = sorted(d.items()) print(s_d) {'a': 3, 'c': 7, 'b': 2, 'd': 1} [('a', 3), ('b', 2), ('c', 7), ('d', 1)] 내림차순 내림차순으로 정렬하기 위해서 reverse = Trur로 설정하면 된다. d = dict(a=3, c=7, b=2, d=1) print(d) s_d = sorted(d.items(), reverse= True) print..

Python/이론, 기초

[Python] deque 스택, 큐 라이브러리 사용하기

deque 스택은 후입선출, 큐는 선입선출의 특징을 가지고 있고 이는 deque를 이용하여 사용가능함 선언 from collections import deque a = [i for i in range(10)] a = deque(a) b = deque('hello python') print(a, b) deque([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) deque(['h', 'e', 'l', 'l', 'o', ' ', 'p', 'y', 't', 'h', 'o', 'n']) pop() 스택은 후입선출이기 때문에 마지막에 들어있는 데이터가 출력됨 from collections import deque a = [i for i in range(10)] a = deque(a) b = deque('hel..

파송송
'Python/이론, 기초' 카테고리의 글 목록