5. R로 data 입력 및 확인 / tip 2개
AWS_sample.txt
iris.csv
데이터 입력
# 데이터 입력
read.csv("파일명") # csv 전용
read.delim("파일명", sep=",") # 구분자 선택해서 아무거나
read.table("파일명", sep=",") # 구분자 선택해서 아무거나
# tsv일 경우 read.table로
read.table("파일명", sep="\t")
# 특정 구분자일 경우 - 쉼표(,)나 탭(\t)이 아닐 경우
read.delim("파일명", sep="구분자")
# 예제 기상청 파일 - R은 통계프로그램이라 자동으로 factor(통계처리요소)로 변환하는데, 그것을 방지하는 코드도 넣어준다.
aws = read.delim("AWS_sample.txt", sep="#", stringsAsFactors = FALSE)
head(aws) # 처음 6개 자료 읽어오기
데이터 입력 실습
#실습 시작
# 1. working directory 확인
getwd()
# 2. iris 데이터(따로 다운받음) - getwd()자리에 있는 경우,
dd = read.csv("iris.csv", stringsAsFactors = FALSE) # dd라는 객체로 받아야, environment창에 뜬다.
# 3. 불러온 후, 작업하기
head(dd)
# 1. working directory 변경 - \가 아닌 / 로 경로 설정되어야함.
setwd('C:/Users/is2js/R_da/data/')
# 2. 디렉토리내 파일확인
list.files()
# 3. AWS(기상청 데이터)
# 윈도우 폴더에서 경로를 복사한 경우, \(|)을 ---> / 로 바꿔줘야함.
aa = read.delim("C:/Users/is2js/R_da/data/AWS_sample.txt",
sep="#",
stringsAsFactors = FALSE)
# 4. 확인하기
head(aa)
aa = read.delim("AWS_sample.txt",
sep="#",
stringsAsFactors = FALSE)
head(aa)
데이터 확인
# 작업영역 설정 다시해주기
getwd()
setwd("C:/Users/is2js/R_da/")
aa = read.delim('data/AWS_sample.txt',
sep='#',
stringsAsFactors = FALSE)
head(aa)
# 데이터 확인
head(aa) # 첨부터 6개 확인
head(aa, 10)
tail(aa) # 마지막 6개 확인
tail(aa, 10)
# 전체 구조 확인 - str() - string(X) structure
str(aa) # 스트럭쳐 / 각칼럼의 이름 : 속성 , 몇개의 데이터를 보여줌
# 요약정보 - summary()
# 숫자는 최소값, 제 1/3 4분위수(제 25/75 백분위수), 중앙값(제 50 백분위 수), 평균값, 최대값
# 문자열은 속성 / 결측치를 알려준다.
summary(aa)
# 객체 구조 및 변수별 기술통계 확인
nrow(aa) # 행의 개수
ncol(aa) # 열의 개수
dim(aa) # 차원(행 X 열) 개수 한꺼번에 확인
colnames(aa) # 컬럼 명만 확인
View(dd) # 창으로 깔끔하게 확인
데이터 확인 실습
TIP ) 주석표시를 4개(좌우 or 우) 넣으면 책갈피처럼 이용 가능하다.
#### 데이터 확인 실습 ####
# 1. 데이터 입력 및 확인
aws = read.delim('data/AWS_sample.txt',
sep='#',
stringsAsFactors = FALSE)
head(aws, 3)
head( x = aws, n = 5)
tail(aws, 1)
# R에서는 print함수를 for문 돌 때, 몇번째 루프 도는지 확인할 때 쓴다.
# 객체 구조 및 변수별 기술통계 확인
str(aws)
summary(aws) # AWS_ID 기기 번호 / TM 시간 / TA 기온 / wind 풍속 / x는 의미x
nrow(aws)
ncol(aws)
dim(aws)
# 데이터를 5887번째로 집어넣고 싶다면 위의 함수들을 이용한다.
# 제일 마지막 끼워넣을 때 / 제일 마지막 지울 때 / 등등에 이용한다
nrow(aws) + 1
colnames(aws)
TIP) 콘솔창의 메뉴 빈칸( terminal메뉴 옆 빈칸)을 더블클릭하면, script창을 덮어서 쭈욱 올라가서 보기 편해진다.
다시 더블클릭하면 내려온다.
'한의대 생활 > └ R studio 기초 및 문법' 카테고리의 다른 글
7. data 병합 및 요약 / 문자열 처리 - splitstackshape 패키지-cSplit() 포함 (0) | 2018.12.27 |
---|---|
6. data 추출 -> 치환 & 삽입 (0) | 2018.12.27 |
4. R의 기본 문법 (0) | 2018.12.26 |
3. R의 기본 자료형 (2) | 2018.12.26 |
2. R studio 의 기본 설정 / 자주쓰는 단축키 (0) | 2018.12.26 |