• R$ 학습된 ANN 모델을 패키지 형태로 배포하기-1

    제가 수행하는 연구 중 하나는 동물이 최적의 생산성과 건강을 유지할 수 있는 영양학적 모델을 만드는 작업입니다. 기존에 사용되던 bloken-line regression 기법(Robins et al., 2006)의 경우 intercept와 각 변수의 coefficient를 사람이 볼 수 있는 숫자로 표시해 책이나 프로그램으로 쉽게 배포할 수 있는데 반해, SVM이라던지 ANN과 같은 black-box 알고리즘을 이용해 만든 모델은...


  • R$ 더러운 데이터 청소하기: janitor package

    다른사람들에게 데이터를 받아서 일하게 되는 경우 대부분 R에 사용하기에 적합한 형태로 되어 있지 않은 경우가 많습니다. 열의 이름이 숫자로 시작한다거나 띄어쓰기가 되어 있다던가 특수문자가 들어있다던가 셀이 병합되어 있다던가 하는 경우입니다. 이런 dirty data를 clean하게 만들어주는 패키지가 있습니다. 바로 janitor 패키지입니다. janitor는 청소부란 뜻을 가지고 있습니다. 이 패키지와 함께 더러운 파일을...


  • R$ 한우 기본/도체/씨수소 정보를 가져오는 패키지: hanwoo package

    이전에 한우 등급판정 결과를 가져오는 함수에 대해 포스팅 한 적이 있는데, 한우의 기본정보/등급판정결과/KPN씨수소정보를 가져올 수 있는 패키지를 제작하였습니다. 아래 내용은 제 Github 저장소에서 제공되는 정보와 일치합니다. Overview 공공데이터포털에서 제공하는 한우의 기본정보, 도체정보 및 KPN 씨수소의 정보를 가져오는 패키지입니다. Installation # install.packages("devtools") devtools::install_github("adatalab/hanwoo") Usage 먼저 data.go.kr에서 API key를 신청하고 그 다음...


  • R$ CRAN+Github에서 패키지를 한번에 다운로드-설치-불러오기: librarian package

    R에서 패키지를 설치하는데 가장 많이 쓰지는 두가지 함수는 아마도 CRAN을 미러로 쓰는 install.packages()와 Github를 미러로 쓰는 devtools::install_github() 함수일 것입니다. 설치된 패키지는 library() 함수를 이용해서 불러올 수 있는데, 이 함수는 여러개의 함수를 동시에 불러 올 수 없을 뿐더러 패키지 다운로드-설치-불러오기를 한꺼번에 할수도 없습니다. 이런 문제(?)를 해결하려면 pacman 패키지의 p_load 함수를 쓰면...


  • R$ 패키지를 검색하는 패키지: packagefinder package

    packagefinder 패키지 패키지는 오픈소스 언어인 R을 더욱 강력하게 만들어줍니다. 전세계 수많은 개발자들에 의해 The Comprehensive R Archive Network (CRAN) 또는 Github을 통해 배포되는 다양한 패키지들이 없었더라면, 얼마나 많은 삽질을시간을 허비하고 있었을지 감히 상상할수 조차 없습니다. R의 패키지 시스템에 대한 소개는 다음글에 잘 설명되어 있습니다. 기본적으로 available.packages()을 사용하면 CRAN에 등록되어 있는...