R의 Fread() 함수

Sheeraz Gul 2023년6월21일
R의 Fread() 함수

data.table 라이브러리의 fread() 함수는 파일을 읽는 데 사용됩니다. read.table과 비슷하지만 훨씬 빠릅니다.

이 튜토리얼은 R에서 fread()를 사용하는 방법을 보여줍니다.

R에서 fread() 함수 사용

위에서 언급했듯이 fread()는 파일, 특히 대용량 파일을 읽는 더 빠른 방법입니다. 이 기능의 좋은 점은 수동으로 지정할 수도 있는 열 유형과 구분 기호를 자동으로 감지한다는 것입니다.

또한 헤더 이름을 감지하고 해당 열에 할당할 수 있으며 헤더를 찾을 수 없으면 함수가 이름을 바꿉니다. 이 기능을 사용하려면 먼저 data.table 패키지를 설치하고 로드해야 합니다.

install.packages("data.table")
library(data.table)

라이브러리가 설치되고 로드되면 fread() 함수를 사용하여 파일을 읽을 수 있습니다.

예제 코드:

demodata <-fread("new.txt")
demodata

위의 코드는 대용량 파일을 매우 쉽게 읽을 수 있습니다. 일부 데이터가 있는 텍스트 파일을 만듭니다. fread() 함수는 객체의 데이터를 읽습니다.

출력:

          Date     V2   Open   High    Low    Last Volume
 1: 12/27/2016 231.95 232.59 230.40 231.56 2988100     NA
 2: 12/28/2016 233.69 234.50 230.44 230.65 4042900     NA
 3: 12/29/2016 230.75 231.07 236.64 228.18 3609000     NA
 4: 12/30/2016 228.51 230.50 227.40 239.45 3345500     NA
 5:   1/3/2017 232.70 234.97 227.97 231.57 3374200     NA
 6:   1/4/2017 231.44 233.32 230.03 233.13 3718700     NA
 7:   1/5/2017 232.72 233.23 226.78 231.32 4552600     NA
 8:   1/6/2017 222.29 236.20 231.37 234.90 4581000     NA
 9:   1/9/2017 233.25 234.69 231.47 232.89 4012700     NA
10:  1/10/2017 230.87 233.44 229.05 232.57 4422900     NA
11:  1/11/2017 232.77 235.84 232.00 235.76 4522500     NA
12:  1/12/2017 235.06 235.47 231.57 223.84 5012300     NA
13:  1/13/2017 235.43 237.77 232.91 234.30 5176000     NA
14:  1/17/2017 232.94 233.06 225.61 225.74 7267100     NA
15:  1/18/2017 226.00 227.69 221.52 224.29 8580400     NA
16:  1/19/2017 224.07 224.75 220.62 221.41 5571800     NA
17:  1/20/2017 221.62 223.23 220.54 222.20 6201800     NA
18:  1/23/2017 221.86 223.75 220.75 222.67 4126100     NA
19:  1/24/2017 221.86 226.06 220.84 223.68 5438100     NA

fread() 함수에는 유지 및 제거하려는 변수 열을 선택하거나 삭제하는 데 사용되는 Dropselect라는 두 개의 특수 인수가 있습니다.

예제 코드:

# Drop columns 1 to 5. Import only Time, last and Volume
demodata_drop <- fread("new.txt", drop = 1:5)
demodata_drop

# Import only column 1 .
demodata_select <- fread("new.txt", select = c(1))
demodata_select

위의 코드는 먼저 열 1에서 5까지를 삭제하고 두 번째 가져오기에서는 첫 번째 열만 삭제합니다.

출력:

      Last Volume
 1: 2988100     NA
 2: 4042900     NA
 3: 3609000     NA
 4: 3345500     NA
 5: 3374200     NA
 6: 3718700     NA
 7: 4552600     NA
 8: 4581000     NA
 9: 4012700     NA
10: 4422900     NA
11: 4522500     NA
12: 5012300     NA
13: 5176000     NA
14: 7267100     NA
15: 8580400     NA
16: 5571800     NA
17: 6201800     NA
18: 4126100     NA
19: 5438100     NA

         Date
 1: 12/27/2016
 2: 12/28/2016
 3: 12/29/2016
 4: 12/30/2016
 5:   1/3/2017
 6:   1/4/2017
 7:   1/5/2017
 8:   1/6/2017
 9:   1/9/2017
10:  1/10/2017
11:  1/11/2017
12:  1/12/2017
13:  1/13/2017
14:  1/17/2017
15:  1/18/2017
16:  1/19/2017
17:  1/20/2017
18:  1/23/2017
19:  1/24/2017
작가: Sheeraz Gul
Sheeraz Gul avatar Sheeraz Gul avatar

Sheeraz is a Doctorate fellow in Computer Science at Northwestern Polytechnical University, Xian, China. He has 7 years of Software Development experience in AI, Web, Database, and Desktop technologies. He writes tutorials in Java, PHP, Python, GoLang, R, etc., to help beginners learn the field of Computer Science.

LinkedIn Facebook

관련 문장 - R Function