ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [R] 데이터 구조
    R 2020. 10. 31. 14:02

    R은 벡터, 팩터, 행렬, 배열, 데이터프레임, 리스트와 같은

    다양한 형식의 데이터 구조를 가지고 있다.

     

    벡터

    동일한 유형의 데이터를 원소로 갖는 데이터 집합이다.

    서로 다른 유형의 데이터는 가질 수 없다.

    c()함수를 이용하여 벡터를 만들 수 있다.

     


     

    팩터(factor)

    벡터의 특수한 형태로, 범주형 값을 원소로 갖는 데이터 집합이다.

     

    5개 제품의 등급을 표현하기 위해 c(“A”, “B”, “C”, “A”, “B”)라는 벡터를 만든다.

    이는 등급을 나타내기 때문에 범주형 값을 갖는 문자 벡터이다.

    Factor()함수에다가 이를 넣으면 팩터(factor)로 변환된다.

     

    문자 벡터와 팩터(factor)가 다른 점은 큰 따옴표(“), 콤마(,)가 사라지고

    Levels 항목에 A B C의 범주가 표시된다.

    범주 값의 순서가 의미가 있을 경우 그 팩터(factor)를

    서열 팩터(ordered factor)라고 부르기도 한다.

     


     

    행렬

    행렬은 두 개의 차원으로 구성된 2차원 벡터이다.

    행렬은 벡터로 구성되기 때문에 각 원소는 모두 동일한 유형이어야 한다.

     

    Matrix() 함수를 이용하여 행렬을 만들 수 있다.

    행이 3이고, 열이 4인, 1부터 12까지의 숫자의 행렬을 만들자.

    이때 콜론(:)은 연속된 숫자를 나타낼 때 쓰는 연산자이다.

     


     

    배열

    세 개 이상의 차원을 만들면 배열이라고 말한다.

    배열은 행렬을 확장해서 세 개 이상의 차원을 만든 것이다.

    행렬과 동일한 구조를 갖는다.

     

    array() 함수를 이용하여 배열을 만들 수 있다.

    행이 2, 열이 3인 행렬이 2개 만들어지고,

    1부터 12까지의 값들이 들어간다.

     


     

    데이터프레임

    데이터프레임은 행렬과 유사한 모습이다.

     

    행렬과 다른 점은 행렬에서는 모든 원소가 같은 유형이어야 하지만

    데이터프레임은 각 열마다 다른 유형의 데이터를 가질 수 있다.

    그래서 행렬보다 더 유연한 데이터 구조이다.

     

    데이터베이스나 통계 데이터 셋과 유사한 구조이기 때문에

    R에서 가장 빈번하게 다루는 데이터 구조이다.

     

    데이터프레임은 data.frame()이라는 함수를 이용하여 만든다.

    행렬과 비슷하지만 각 열은 서로 다른 데이터 유형을 가진다.

     


     

    리스트

    일종의 객체 집합을 나타낸다.

     

    다양한 객체들을 하나의 리스트로 나타낼 수 있다.

    리스트 안에는 벡터, 행렬, 배열, 데이터프레임, 리스트 자체도 들어갈 수 있다.

    리스트 안의 객체들은 각 원소의 길이나 개수가 달라도 상관없다.

    그러므로 리스트는 가장 유연한 형태의 데이터 구조이다.

     

    List함수()를 사용하여 만든다.

    리스트 안에 각각 다른 형태의 데이터 구조가 들어간 것을 볼 수 있다.

     


    유튜브에서 공부한 내용 정리

    https://youtu.be/7zEEiFQWyzg

    'R' 카테고리의 다른 글

    [R] 벡터 연산  (1) 2020.10.31
    [R] 벡터 생성  (1) 2020.10.31
    [R] 패키지  (1) 2020.10.31
    [R] 작업 디렉토리  (1) 2020.10.31

    댓글

Designed by Tistory.