일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 계묘년
- Cannon PowerShot G7 X Mark III
- 둠칫새
- 곤줄박이
- 영화 일기
- 심리학
- 외생균근균
- 에리히 프롬
- RStudio
- 바운새
- 청도요
- 젖비단그물버섯
- mushroom #mushrooms #mushroomhunting #mushroomphotos #mushroomphotography #mycology #mycologist #fungi #fungalecology #fungaldiversity #fantasticfungi #버섯 #탐균 #버섯탐사
- 영화 후기
- Rstuido
- 영화
- 철학
- 파이썬
- 코딩
- 생물정보학
- 영화 해석
- 토양미생물학
- 탐조
- 대학원생
- 토양학
- 영화 리뷰
- 더 웨일
- 생명과학 균학 미생물학 Biology Mycology Microbiology
- 갓생
- R
Archives
- Today
- Total
워라밸 중독자
[R] 데이터 구조 종류 및 확인 (스칼라, 벡터, 팩터, 리스트 / 행렬, 데이터프레임 / 배열) 본문
코딩, 딱 지금이 시작할때! (코딱지)
[R] 데이터 구조 종류 및 확인 (스칼라, 벡터, 팩터, 리스트 / 행렬, 데이터프레임 / 배열)
Ufungi 2023. 1. 6. 00:32데이터 구조 분류
R의 데이터 구조는 차원과 자료형에 따라 나눠진다.
- 차원은 특정 데이터 값을 찾을 때 필요한 정보의 개수이다. 1차원 데이터는 x축의 값만 알면 데이터 값을 찾을 수 있지만, 2차원 데이터의 경우 x축과 y축의 값을 모두 알아야 데이터 값을 찾을 수 있다.
- 데이터의 자료형이 문자형, 숫자형, 논리형 중 한 가지로 이루어졌으면 단일형, 여러가지로 이루어졌으면 다중형이다.
1차원 데이터
- 단일형: 스칼라 (scalar), 벡터 (vector), 팩터 (factor)
- 다중형: 리스트 (list)
* 데이터 분석시 주로 벡터를 다루며, 팩터와 리스트는 많이 다루지 않는다.
[R] 벡터(vector) 정의 및 생성
벡터(vector)란? 동일한 자료형(정수, 실수, 문자, 논리)의 값이 연속적으로 나열된 자료구조이다. 엑셀에서 '한 행'에 해당하며 일차원 데이터를 저장한다. 벡터 만들기 1. c 함수 concatenate의 첫 글
ufungi.tistory.com
[R] 1차원 데이터 구조 - 팩터(factor)와 리스트(list)
데이터 분석시 주로 벡터를 다루며, 팩터와 리스트는 많이 다루지 않는다. 그래도 한 번 알아보자. 팩터(factor) 벡터와 유사하나 한 가지 다른 점은 지정된 원소가 아닌 값은 허용하지 않는다. * re
ufungi.tistory.com
2차원 데이터
2차원 데이터는 여러개의 벡터가 결합된 구조로, 일반적으로 하나의 벡터는 하나의 열(column)에 해당한다.
- 단일형: 행렬 (matrix)
- 다중형: 데이터프레임 (data frame)
[R] 2차원 데이터 구조 - 행렬(matrix)과 데이터프레임(dataframe)
1. 행렬과 데이터프레임의 차이 행렬 2차원, 단일형 데이터 구조. 모든 원소들의 자료형이 동일하다. 데이터프레임 2차원, 다중형 데이터 구조. 각 column 내에서 원소들의 자료형이 동일하다 (column
ufungi.tistory.com
n차원 데이터
- 단일형: 배열 (array)
- 다중형 없음
데이터 구조 확인 함수
데이터를 요약하거나 구조를 확인할 수 있는 함수는 다음과 같다.
함수명 | 기능 |
str() | 데이터 구조, 자료형 등을 요약하여 출력 |
class() | 데이터 구조 출력 |
dim() | 차원 출력 (행 및 열의 수) |
nrow() | 행의 수 출력 |
ncol() | 열의 수 출력 |
names() | 열 이름 출력, colnames()와 동일 |
head() | 데이터셋의 앞부분 일부 출력 |
tail() | 데이터셋의 뒷부분 일부 출력 |
위 함수들을 이용해 iris 데이터셋의 정보를 확인했다.
> str(iris) # 데이터 구조, 자료형 등을 요약하여 출력
'data.frame': 150 obs. of 5 variables:
$ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
$ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
$ Petal.Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
$ Petal.Width : num 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
$ Species : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...
> class(iris) # 데이터 구조 출력
[1] "data.frame"
> dim(iris) # 차원 출력 (행 및 열의 수)
[1] 150 5
> nrow(iris) # 행의 수 출력
[1] 150
> ncol(iris) # 열의 수 출력
[1] 5
> names(iris) # 열 이름 출력, colnames()와 동일
[1] "Sepal.Length" "Sepal.Width" "Petal.Length" "Petal.Width" "Species"
> head(iris) # 데이터셋의 앞부분 일부 출력
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
> tail(iris) #데이터셋의 뒷부분 일부 출력
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
145 6.7 3.3 5.7 2.5 virginica
146 6.7 3.0 5.2 2.3 virginica
147 6.3 2.5 5.0 1.9 virginica
148 6.5 3.0 5.2 2.0 virginica
149 6.2 3.4 5.4 2.3 virginica
150 5.9 3.0 5.1 1.8 virginica
'코딩, 딱 지금이 시작할때! (코딱지)' 카테고리의 다른 글
[R] 2차원 데이터 구조 - 행렬(matrix)과 데이터프레임(dataframe) (1) | 2023.01.06 |
---|---|
[R] 1차원 데이터 구조 - 팩터(factor)와 리스트(list) (0) | 2023.01.06 |
[R] 1차원 데이터 구조 - 벡터의 연산 (산술연산, 논리연산, 함수) (0) | 2023.01.05 |
[R] 특수문자 자료형 (NULL, NA, NaN, inf/-inf) (0) | 2023.01.05 |
[R] R studio 유용한 단축키 (0) | 2022.12.27 |