csv 파일을 json으로 바꿔야 하는 상황이 생겨서 변경하고자 한다. import csv import json import pandas as pd csv_file_path = '파일 경로' data = df_tweet = pd.read_csv(csv_file_path) data with open(csv_file_path, 'r', encoding='utf-8') as f: reader = csv.reader(f) next(reader) # 첫 줄 skip # 각 라인마다 딕셔너리 생성 후 리스트에 추가 data = [] for line in reader: d = { 'Topic': line[0], 'Sentiment': line[1], 'TweetId': int(line[2]), 'TweetDate':..
Numpy에서는 난수를 생성하는 method들이 있음 random.rand() 0~1 사이의 랜덤 한 실수를 생성한다.(1은 포함되지 않음) rand() 안에 아무것도 안 나오면 스칼라값이 나오고 나머지는 입력한 크기에 맞게 벡터값이 나온다. import numpy as np test = np.random.rand(3,4) print(test) [[0.72298894 0.53186953 0.52394924 0.89806408] [0.56625083 0.34967767 0.75511065 0.16174391] [0.19854568 0.90354496 0.07178789 0.59389605]] randint(min, max) min, max 사이의 범위의 정수를 랜덤 하게 반환해 준다.(max는 포함되지 않..
데이터 받기 dataset을 datasets으로 받아준다. train_dataset = datasets.MNIST(config.data_path, train=True, download=True, transform=config.augmentation ) 그러고 data Loader에 넣어주면 다음과 같이 data정보가 나온다. 60000장의 데이터를 500장으로 줄이는 작업을 할 것이다. 데이터 나누기 먼저 dataloader를 list로 만들어준다. 이렇게 하면 슬라이스 작업을 할 수 있다. a=list(train_loader) (20, 1, 64, 64) (2,) 3000 a는 64x64x1 이미지가 20(batch) 개 있고 그것에 대한 label 값을 합쳐서 3000개의 세트를 가지고 있음 trai..
Pythorch를 모듈을 사용하여 tensor 객체 만드는 방법 tensor numpy의 array와 같지만 GPU 계산에서 사용됨 설정 행렬 사용자가 원하는 값을 넣어 행렬을 만듦 Zeros(size) 0이 들어있는 행렬을 return 함 x = torch.zeros(5, 3) x tensor([[0., 0., 0., 0., 0.], [0., 0., 0., 0., 0.]]) x = torch.zeros(2, 5, dtype=torch.bool) x tensor([[False, False, False, False, False], [False, False, False, False, False]]) Ones(size) 1이 들어있는 행렬을 returng 함 x = torch.ones(3,2) x tensor..
https://codetorial.net/numpy/random.html Matplotlib와 함께 정리가 잘된 사이트 NumPy 난수 생성 (Random 모듈) - Codetorial 예제1 - 기본 사용 import numpy as np a = np.random.randn(5) print(a) b = np.random.randn(2, 3) print(b) sigma, mu = 1.5, 2.0 c = sigma * np.random.randn(5) + mu print(c) [ 0.06704336 -0.48813686 0.4275107 -0.9015714 -1.30597604] [[ 0.87354043 0.03783 codetorial.net Random 서브 모듈 Random 모듈에 있는 다양한 함수를..