6. 기초 라이브러리 Numpy(넘파이) 사용하기 (import, 데이터형, array연산)
2018. 2. 22. 22:40
넘파이는 백터 및 행렬연산에 있어서 엄청난 편의성을 제공한다. 추후 사용할 판다스와 맷플롯립 등의 기반이되는 라이브러리다.
기본적으로 array라는 단위로 데이터를 관리한다. 고등수학의 행렬과 대단히 유사한 부분이 많다.
array 사용
- 먼저, 노트북에 numpy 라이브러리를 import해야한다.
import numpy as np 에서 np는, 앞으로 셀에서는 약자np. 으로 사용할 것이라는 의미이다. - data1에, 성분이 5개인 일차원 리스트를 만들고, data1을 인자로하여 새로운 arr1이라는 array를 생성하자.
arr1 이라는 array이는 크기가5 짜리인 1차원 array이다. (리스트 생성 – > np.array)
생성한 array의 크기정보를 트래킹 하기 위해서는 array안의 멤버변수 .shape로 확인한다.
예제의 경우 array의 크기가 5이므로 5가 출력된다.(행은 없고 열만 5개라는 의미이다) - 2차원 리스트를 만들어서 –> array 에 담아보자.
이 때, arr2는 2 x 4 짜리 array가 되는 것이다. shape로 확인해보자( 행 , 열 순으로 표시된다) - 특수한 array경우에는 리스트-> np.array( 리스트) 의 과정없이도 한방에 만들 수 있다.
예를 들어, 0으로만 구성된 3 X 6의 배열은 np.zeros( (행, 열 ) )라는 함수로 바로 생성가능하다.
마찬가지로, 1으로만 구성된 배열은 np.ones( (행, 열))로 생성가능하다. 이번에는 1차원으로 열만 입력해보자.
또 특수한 np.arange 함수는 0부터 n-1까지 간격이 1인, array를 한번에 생성한다.
array의 데이터형 in Numpy
- 파이썬에 데이터형이 있듯이, 넘파이에서도 array의 고유한 데이터형을 가진다. 이 데이터형은
dtype이라는 멤버변수를 이용해, 생성한 array의 데이터형을 확인할 수 있다.
arr1의 인자인 data1에는 실수인 7.5가 포함되어 있었기 때문에, 넘파이에서 자동으로 float64형으로 array를 만들었던 것이다.
arr2에는 모두 정수인 리스트 data2를 인자로 가졌기 때문에, 자동으로 int64형 array를 만들었다. - 데이터형은 생성시 직접 지정할 수도 있다. np.array()함수의 인자에 리스트와 동시에, dtype = np.데이터형64을 같이 입력해주면 된다.
* 참고로 int나 float 뒤의 숫자는 메모리상에서 몇 bit를 이용해서 해당array의 각 성분을 표시할지를 나타내는 것이다.
더 큰 숫자를 사용할 수록 더 큰 숫자를 표현할 수 있다. - 기존의 array 데이터형을 변환하여 새로운 array를 만들수 있다. astype( np.바꿀데이터형64 )이라는 함수를 사용하면 된다.
생성한 뒤, dtype멤버변수로 확인해보자. - 그 이외에 데이터형 정리
array의 연산
array에 대해서는 + , – , *, / 가 적용이 된다.
'빅데이터 관련 프로그래밍 > Python - bigdata(pandas 기초)' 카테고리의 다른 글
8. Numpy array 함수( 특정계산, 통계함수, 정렬함수) (0) | 2018.02.23 |
---|---|
7. Numpy array 인덱싱( 기본인덱싱, boolean인덱싱(마스크)) (2) | 2018.02.23 |
5. iPhython Notebook 살펴보기 (1) | 2018.02.22 |
4. iPython 살펴보기 (0) | 2018.02.22 |
3. 윈도우에서 파이썬(python) 및 파이썬 라이브러리(numpy, pandas, matplotlib, jupyter) 설치 (0) | 2018.02.22 |