본문 바로가기
반응형

전체 글116

R 기본 명령어(cf. python) - [Dataframe, %>% Handling] Intro R 기초 마지막으로 dataframe과 해당 자료형을 활용한 Data handling에 대한 내용을 정리해보겠습니다. dataframe이라는 자료형은 python - pandas에서도 유용하게 사용하고 있으며 해당 라이브러리와 Numpy를 활용하여 Data handling에 적극활용하는 유용한 handling 도구입니다. Dataframe 톺아보기 기본적으로 read.csv("000.csv)"로 데이터를 불러오면 Dataframe 자료형으로 받아오지만, 이번에는 직접 dataframe을 만드는 과정에 대해서 살펴보고 사용할 수 있는 handling 도구에 대해 알아보겠습니다. 먼저 Dataframe을 만들기 위해선 배열이 필요합니다. Dataframe 생성 Dataframe 생성은 코드의 가독.. 2024. 4. 1.
R 기본 명령어(cf. python) - [문자열함수, 제어문과 반복문] Intro R 기본 명령어 중에서 이번에는 문자열과 관련된 함수들과 제어문에 대해서 살펴보도록 하겠습니다. 마찬가지로 Python에서 사용하는 함수들과 어떤 차이점이 있는지에 대해서 비교해보면서 공부한 내용을 정리해보도록 하겠습니다. 문자열 함수 R에서 제공하고 있는 문자열 함수는 Python에서 사용하는 방식과 차이가 많습니다. 그래서 이번에는 비교하면서 외우는 것을 먼저 하기보다는 각자의 방식에 대해서 이해한 후에 어느정도 익숙해지고나서 비교해보면 좋을 것 같습니다 . R에서 사용하는 문자열 함수 주석으로 파이썬에 똑같은 기능을 구현하는 함수들을 적어놓았습니다. 확실히 R이 좀 더 사용자 친화적인 고수준 언어라고 느껴지네요. 하지만 파이썬을 앞으로도 많이 활용하게 될테니 주석에 있는 수준 정도는 반드.. 2024. 3. 31.
R 기본 명령어(cf. python) - [나눗셈, 반올림, 수학함수] Intro R 기본명령어에 대해서 살펴보는 중, Python과 문법에 차이가 나는 것들을 일부 발견해서 이를 기록해두고자합니다. 이번 게시글에서 다룰 내용은 나눗셈, 반올림/올림/내림/버림, 그 외 기본적인 수학 함수들에 대한 내용입니다. 나눗셈 Python에서 나눗셈 연산과 R에서의 나눗셈 연산에서 연산자에 차이가 있어서 이를 아래 표에서 정리해두었습니다. Python R 나누기 / / 몫 // %/% 나머지 % %% 실제로 나눗셈 검산식을 통해서 연산자의 결과를 확인해보면 아래와 같습니다. Python을 자주 사용하는 필자의 경우에 이렇게.. 기본 연산자가 바뀌면 조금 헷갈리는 경우도 있는 것 같아서 많이 사용해보면서 정리해둬야겠습니다.. 반올림/올림/내림/버림 Python에서 반올림과 그외 올림/내.. 2024. 3. 31.
R 기본 명령어(cf. python) - [scan, print, cat] Intro 기본적으로 Python을 다룰 줄 아는 선에서 Python과 R사이에 어떤 차이가 있는지 정리해보도록 하겠습니다. scan() Python에서는 동적 프로그래밍이 지원되어 input()이라는 함수에 어떤 자료형을 넣어도 적절하게 할당되지만, R에서 input과 유사하게 데이터를 받아주는 함수 scan에서는 기본적으로는 수치형 자료형을 받아주며 문자 또는 문자열을 받기 위해선 what=character()이란 parameter를 활용해줘야합니다. 다만 여러개를 입력할 시에는 자동으로 배열에 담아준다는 특징이 있습니다. Print(), Cat() Python과 마찬가지로 print함수를 통해서 값을 출력할 수 있습니다. 하지만 Python에서 print함수와 달리 R에서는 print를 통해서는 한.. 2024. 3. 31.
R 개발환경 구축하기 Intro 학교에서 공부하다보면 수업에서 R을 사용하는 경우가 종종 있습니다. 아무래도 과거 R이 유행했을 때 많은 분들이 사용하신 도구라서 아직까지도 종종 쓰이는 것 같아요. 이번 게시글에서는 R언어와 IDE인 R-studio까지 설치하는 방법에 대해 다뤄보도록 하겠습니다. Install R(language) R을 설치하기 위해선 cran에서 관리하고 있는 R 버전을 설치하면 됩니다. 진행하고자하는 프로젝트에 호환되는 버전을 미리 알아낸 후에 본인 OS에 종속되는 버전을 알맞게 설치하시면 됩니다. cran 주소는 링크를 클릭하시면 됩니다 ! R - install cran.r-project 첨부된 링크에 들어가시면 아래와 같은 창이 뜹니다. 창을 확인해보시면 Last modified 컬럼을 통해 최근 업.. 2024. 3. 31.
3. Prompt : Self Consistency (with Few Shot + CoT) 2024. 2. 26 역시나 지난 게시글에 이어 CMYK 스터디 2기 첫번째 활동에 대해서 리뷰해보겠습니다. 이번 시간에는 지난 번에 다뤘던 Zero/One/Few Shot에 Chain of Thought 에 여러 CoT 중 특정 기준에 의해서 가장 적합한 CoT를 채택하여 답변을 생성하도록 유도하는 Self-Consistency에 대한 예를 다뤄보려고 합니다. 사실 논문들도 review해봐야겠지만.. 이는 따로 정리해서 댓글에 추가해보도록 하겠습니다. 이번 내용부터는 이전에 다뤘던 내용들에 대해서 이해하고 오셔야하기 때문에 아래 게시글들을 보고 오시는 것을 추천드립니다. 어렵지않은 개념들이라 빠르게 보고오시면 좋을 것 같습니다. 2024.02.29 - [KaKR - CMYK] - 1. Prompt : .. 2024. 2. 29.
2. Prompt : CoT (with Zero/One/Few Shot) 2024. 2. 26 지난 게시글에 이어 CMYK 스터디 2기 첫번째 활동에 대해서 리뷰해보겠습니다. 이번 시간에는 지난 번에 다뤘던 Zero/One/Few Shot에 Chain of Thought 정보를 추가하는 Prompt에 대해서 알아보겠습니다. 프롬프트 작성 지침 (1) 지침은 명확하고 구체적으로 (2) 간결하게 작성 (3) 행동 동사 사용(action verbs) - 행동 동사로 명령 요소를 시작 "Summarize the given text" (4) 충분한 맥락을 제공 - 충분한 배경 정보를 제공 (5) 구분 기호(delimiter) 사용 • 프롬프트의 다른 요소를 분리해서 프롬프트를 더 잘 이해할 수 있도록 도움. (6) 톤 지정 - 생성된 출력의 스타일, 형식 및 전반적인 감정을 결정함 (.. 2024. 2. 29.
1. Prompt : Zero/One/Few Shot 2024. 2. 26 CMYK 스터디 2기 첫번째 활동이었습니다. 발표는 한시간동안 진행되었고 LLM에서 Fine-Tuning을 하지않아도 NLP Task를 수행할 수 있게 만들어주는 zero/one/few shot에 대한 이야기와 발전하는 prompt engineering에 대한 방향에 대해서 공부할 수 있었던 시간이었습니다. 본 발표를 통해서 Zero/One/Few Shot이 한번의 Prompt에 제공되는 예제량에 의해서 나뉜다는 것을 알게 되었습니다. 프롬프트 작성 지침 (1) 지침은 명확하고 구체적으로 (2) 간결하게 작성 (3) 행동 동사 사용(action verbs) - 행동 동사로 명령 요소를 시작 "Summarize the given text" (4) 충분한 맥락을 제공 - 충분한 배경 정.. 2024. 2. 29.
CMYK - 활동 주제 및 컨벤션 정하기 2024. 02. 13 CMYK에서 1년간 스터디원들과 공부하기 다음의 두 가지를 스터디원들과 이야기해보았습니다. 1. 자신의 Github Convention 소개하기 : 각자의 Repo에 구현한 내용을 다른 스터디원들이 이해하기위해 공유합니다. 2. 1년간 연재할 스터디 주제 소개하기 : 스터디원들에게 앞으로 1년간 다룰 내용에 대해서 소개하며 피드백을 공유합니다. 추가로 계속해서 스터디를 이탈하는 인원들이 발생하여 적당한 이유없이 스터디를 무단 이탈한 자에 대해서는 영구제명 조치를 취하겠습니다. 그리고 중도 하차한 인원으로 스터디 일정에 공백이 생긴 부분은 NLP 분야는 아니지만 ADP에서 다루는 주제에 대해서 제가 정리한 부분들을 팀원들과 공유하거나 모여서 각자 코딩 등 자유롭게 시간을 보내는 것으.. 2024. 2. 16.
반응형