데이터 받기 dataset을 datasets으로 받아준다. train_dataset = datasets.MNIST(config.data_path, train=True, download=True, transform=config.augmentation ) 그러고 data Loader에 넣어주면 다음과 같이 data정보가 나온다. 60000장의 데이터를 500장으로 줄이는 작업을 할 것이다. 데이터 나누기 먼저 dataloader를 list로 만들어준다. 이렇게 하면 슬라이스 작업을 할 수 있다. a=list(train_loader) (20, 1, 64, 64) (2,) 3000 a는 64x64x1 이미지가 20(batch) 개 있고 그것에 대한 label 값을 합쳐서 3000개의 세트를 가지고 있음 trai..
https://www.acmicpc.net/problem/2908 2908번: 상수 상근이의 동생 상수는 수학을 정말 못한다. 상수는 숫자를 읽는데 문제가 있다. 이렇게 수학을 못하는 상수를 위해서 상근이는 수의 크기를 비교하는 문제를 내주었다. 상근이는 세 자리 수 두 www.acmicpc.net 나의 풀이 range를 역순으로 사용하여 반대로 값을 구했음 num = list(map(str,input().split())) ans = ['' for _ in range(2)] for idx in range(2,-1,-1) : ans[0] += num[0][idx] ans[1] += num[1][idx] print(max(int(ans[0]), int(ans[1]))) 다른 사람의 풀이 파이썬 슬라이스를 이..
슬라이스 Slices 파이썬의 배열은 [::]을 사용해서 배열을 변형할 수 있음 구조 기본적으로 arr [Start:End:Step]의 구조를 가지고 있음 각 파라이터에 값이 없다면 Start = 맨 처음, End = 끝, Step = 1로 볼 수 있음 예제 arr = list([1,2,3,4,5,6,7,8,9,10]) print(arr[::]) print(arr[2::]) print(arr[:9:]) print(arr[::2]) [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] [3, 4, 5, 6, 7, 8, 9, 10] [1, 2, 3, 4, 5, 6, 7, 8, 9] [1, 3, 5, 7, 9] 여기서 Start는 기존의 배열 index(0부터 시작하는 인덱스)로 쓰고 End는 Index+..
https://www.acmicpc.net/problem/1152 1152번: 단어의 개수 첫 줄에 영어 대소문자와 공백으로 이루어진 문자열이 주어진다. 이 문자열의 길이는 1,000,000을 넘지 않는다. 단어는 공백 한 개로 구분되며, 공백이 연속해서 나오는 경우는 없다. 또한 문자열 www.acmicpc.net 나의 풀이 데이터를 받고 split()을 실행하여 문장 단위로 나눔 나눠서 list가 된 데이터의 len을 구하면 됨 a = input().split() print(len(a)) print(len(input().split()))
https://www.acmicpc.net/problem/2675 2675번: 문자열 반복 문자열 S를 입력받은 후에, 각 문자를 R번 반복해 새 문자열 P를 만든 후 출력하는 프로그램을 작성하시오. 즉, 첫 번째 문자를 R번 반복하고, 두 번째 문자를 R번 반복하는 식으로 P를 만들면 된다 www.acmicpc.net 나의 풀이 list로 입력값을 받으면 list [0]에는 반복 횟수, list [1]에는 문자열이 들어있다. for문으로 입력값을 받고 이를 반복 횟수만큼 출력함 보기와 같게 나와야하기 때문에 end=''을 사용함 for num in range(int(input())): info = input().split() for word in info[1]: print(word*int(info[0]..
KNN(K-Nearest Neighborhood) 직관적인 머신러닝 분류(Classification) 알고리즘으로 새로 들어온 관측치 주변의 k개의 sample을 이용하여 관측치를 분류한다. 아래의 녹색점이 새로 들어온 관측치이다. k = 1일 때, 녹색점은 가장 가까운 k개의 데이터 중 파란색이 많기 때문에 Class A로 분류된다. k = 7일 때, 녹색점은 가장 가까운 k개의 데이터 중 빨간색이 많기 때문에 Class B로 분류된다. K 정하기 k는 KNN에서 중요한 파라미터로 너무 작으면 과적합이 발생하고 너무 크면 과소적합이 발생한다. 큰 K 미세한 경계 부분을 잘 분류하지 못함 과소적합이 발생함(모델이 간단해짐) 작은 K 이상치의 영향을 크게 받음 패턴이 직관적이지 않을 수 있음 과적합이 발생..
https://www.acmicpc.net/problem/10809 10809번: 알파벳 찾기 각각의 알파벳에 대해서, a가 처음 등장하는 위치, b가 처음 등장하는 위치, ... z가 처음 등장하는 위치를 공백으로 구분해서 출력한다. 만약, 어떤 알파벳이 단어에 포함되어 있지 않다면 -1을 출 www.acmicpc.net 나의 풀이 문제 알파벳 소문자로만 이루어진 단어 S가 주어진다. 각각의 알파벳에 대해서, 단어에 포함되어 있는 경우에는 처음 등장하는 위치를, 포함되어 있지 않은 경우에는 -1을 출력하는 프로그램을 작성하시오. 입력 첫째 줄에 단어 S가 주어진다. 단어의 길이는 100을 넘지 않으며, 알파벳 소문자로만 이루어져 있다. 출력 각각의 알파벳에 대해서, a가 처음 등장하는 위치, b가 처음..