본문 바로가기

반응형

코딩/자연어처리

[생성형 AI]Chat GPT 효율적으로 사용하기 - 프롬프트 엔지니어링 최근 Chat GPT를 좀더 효율적으로 사용할 수 있는 방법에 대해 공부하고 있다. 유튜브에서 좋은 영상을 하나 찾았고, 영상의 내용을 간단히 정리할 겸 올려보는 포스팅. 1. LLM의 Emergent Ability LLM은 파라미터수가 많고 인공신경망으로 이루어진 언어모델이다. 영상에서는 LLM이 Emergent Ability라는 특징을 가진다고 설명한다. 이 특징에 따라 LLM은 3가지 능력을 가지는데 Instruction Following, In-Context Learning, Step-by-Step resoning을 말한다. 1) Instruction Following : LLM은 명령어를 그대로 따른다. "나이거에 대해 알려줘?"라는 질문을 했을 때, 이전의 통계학적인 언어모델과 LLM을 비교해.. 더보기
[생성형 AI]Chat GPT에게 '너 스스로를 정의해봐'라는 질문을 한다면 Chat GPT에게 '너 스스로를 정의해봐'라는 질문을 올려봤다. ChatGPT가 직접 본인을 소개하는 글에는 생성형 AI 특징들이 모두 들어가있다. 이 것을 몇가지로 추려보면 아래와 같이 5가지 특징으로 정리할 수 있다. 아래 특징들은 생성형 AI의 특징이라고도 말할 수 있다. 대규모 언어 모델(Large Language Model)이다. 방대한 데이터로 학습되었다. 입력으로 주어진 문장을 이해하고 새로운 문장을 생성할 수 있다. 텍스트를 기반으로 하는 상호작용을 다룬다. 자아나 의식을 가지고 있지 않고 프로그래밍대로 움직인다. 1. 대규모 언어 모델(Large Language Model)이다. 대규모 언어 모델(LLM, Large Language Model)이 무엇이라고 이야기 하기 전에 우리는 언어.. 더보기
[NLP] Down-stream 모델 개발 과정(Flow chart) ※ 개인적으로 공부한 내용을 정리한 글입니다. 잘못 된 정보가 있을 수 있는 점 참고해주세요. ※ 틀린 부분이나 문의 사항은 댓글로 피드백해주시면 감사하겠습니다. 자연어처리를 공부하는 과정에서 큰 흐름을 한번 정리가 필요할 것아 작성하는 글. 각 과정을 상세히 기록하면서 공부하는 것도 좋겠지만 먼저, 큰 그림을 그려놓고 키워드 중심으로 자료를 정리하면 좋을 것 같아서 먼저 이 글을 작성한다. 아래 이미지는 데이터 수집이 완료되었다는 전제로 작성한 것이다. 내가 이해한 일반적인 자연어처리 모델 개발 과정은 아래와 같다. 제목의 down-stream은 내가 직접 풀고자 하는 문제라고 이해하면 된다. 예를 들어, 뉴스 기사를 topic에 따라 분류하는 예측 모델이 필요하다고 해보자. 그럼 여기서 down-st.. 더보기

반응형