본문 바로가기
반응형

Python15

Pandas - 1 이번 장에서는 간단히 pandas 라이브러리란 무엇이고 pandas의 시리즈 type에 대해서 설명하겠다. # Pandas - 데이터 처리 및 분석을 위한 라이브러리 - 대용량 데이터를 안정적이면서도 간편하게 처리 - 서로 다른 데이터타입으로 열을 구성할 수 있음 - (참고) Numpy : 전체 배열 원소를 동일한 타입으로 제한 - 주요 기능 - 데이터 입출력: csv,excel,RDB 등 다양한 포맷의 데이터를 효율적으로 처리할 수 있는 형식을 사용 - 데이터 가공 : 분리, 결합, 계층, 피봇 등 - 통계 분석 처리 위와 같은 특징 때문에 데이터를 분석하기 위해서는 pandas 라이브러리의 설치는 기본이라고 할 수 있다. pandas 설치는 import pandas as pd 를 첫 셀에 설치가 기본.. 2020. 1. 31.
Numpy - 6 numpy - 6 까지 올 줄은 몰랐지만 지겹던 numpy의 마지막이다. 집계함수를 마지막으로 numpy 파트를 끝내겠다. 이번 시작도 물론 import numpy as np 이다. ## Numpy 배열 연산 집계함수 - Numpy 배열에 대해 집계 함수를 적용할 때는 반드시 axis로 설정된 기준에 따라 연산 수행 - 별도로 값을 지정하지 않으면 기본값은 axis = None으로 지정 - axis - axis=None - 전체 데이터를 하나의 배열로 간주하고 집계 함수의 연산 범위를 전체 배열로 지정 - axis=0 - 열을 기준으로 동일한 열에 있는 요소를 하나의 그룹으로 묶어 집계 함수의 연산 범위로 지정 - axis=1 - 행을 기준으로 동일한 행에 있는 요소를 하나의 그룹으로 묶어 집계 함수의 .. 2020. 1. 22.
Numpy - 5 import numpy as np 는 기본으로 하고 시작하자. ## 산술연산 - 더하기: +,add() - 빼기: -, subtract() - 나누기: /, divide() - 곱하기" *, multiply() - 지수곱 표현: exp() - 제곱근: sqrt() - 로그: log() - 내적(행렬곱): dot() # 아이템: 1이상 10 미만의 1씩 증가 # 구조: 3*3 a=np.arange(1,10).reshape(3,3) # 아이템:1 # 구조 : 3*4 b=np.ones((3,3)) # 아이템: 10 이상 22미만의 1씩 증가하는 숫자 # 구조 3*4 c=np.arange(10,22).reshape(3,4) 먼저 계산을 할 a,b,c 행렬을 생성한다. a+b #out array([[ 2., 3... 2020. 1. 22.
Numpy array - 4 3까지는 배열을 생성하는 것에 초점을 맞췄다면 이제는 배열을 다루는 것에 초점을 맞출 것이다. 기본적으로 import numpy as np를 실행하고 그 전에 썼던 사용자 정의 함수 np_print(arr)를 다시 재정의하자. import numpy as np def np_print(arr): txt=''' shape : {} ndim: {} dtype: {} data: \n {} '''.format(arr.shape,arr.ndim,arr.dtype,arr) print(txt) # 배열 정렬 - sort(axis=-1)메서드:axis를 기준으로 요소를 오름차순 정렬 - 기본값(axis=-1): 현재 배열의 마지막 axis - axis=0: 열 단위 정렬 - axis=1: 행 단위 정렬 - 원번 객체에 .. 2020. 1. 7.
Numpy array - 3 ## 배열 생성 및 초기화 난수를 데이터로 가지는 배열을 생성 - np.random.normal() - np.random.rand() - np.random.randn() - np.random.randint() - np.randoml.random() ### np.random.normal(loc=0.0,scale=1.0,size=None) - 정규 분포 확률 밀도에서 표본을 추출하여 데이터로 가지는 배열 생성 - loc: 정규분포의 평균, 기본값=0.0 - scale: 정규분포의 표준편차, 기본값=1.0 - size:(행,열,차원)배열 구조, 기본값=single value(배열이 아닌 하나의 값을 반환) random이기 때문에 실행 때 마다 값이 달라진다는 것에 유의하자! data= np.random.nor.. 2020. 1. 7.
Numpy array -2 Numpy array -1 에서는 기본적인 배열 생성과 배열 구조에 대해서 알아보았다. 이번 장에서는 numpy의 간단한 함수를 통해 간단한 array를 생성시키는 것을 알아볼 것이다. # 배열 생성 및 초기화 1. 초기값을 지정하여 데이터를 자동으로 가지는 배열을 생성 - np.zeros() - np.ones() - np.full() - np.eye() 간단하게 배열을 초기화 하는 함수 4가지가 있다. 먼저 np.zeros()에 대해서 알아보겠다. 말그대로 배열을 0으로 초기화 시키는 함수이다. np.zeros(shape) - 지정된 구조의 배열을 생성하고 모든 요소를 0으로 초기화 - shape: scala(1차원 배열) 또는 tuple type(2차원 배열/행.열)으로 구조를 지정 간단한 예시 코드.. 2020. 1. 7.
반응형