AI가 보는 우리 톡방은 어떨까?
Chat-GPT API를 활용한 카카오톡 채팅방 AI 분석 서비스
[서비스 바로가기]
🔗 https://www.highlightalk.site/
[테스트용 계정]
ID: [email protected]
PW: 11111111
✏️ AI가 보는 우리 톡방은 어떨까?
하이라이톡 서비스로 카카오톡 대화를 AI로 분석해보세요! 대화방에서 나눈 이야기들을 GPT-4omini 모델을 통해 정밀하게 분석해드립니다.
INFO | |
---|---|
서비스 URL | https://www.highlightalk.site/ |
GitHub URL | https://github.com/FRONTENDSCHOOLPLUS2/HighlighTalk |
개발 기간 | - 기획: 24.07.28 ~ 24.08.11 (약 2주) - 개발: 24.08.11 ~ 24.08.27(약 2주) |
팀 구성 | FE개발자 3인 (김설하, 윤우중, 여다희) |
- 🤖 Chat GPT가 대화 내용을 분석해드려요 ‘우리는 어떻게 대화하고 있을까?’, ‘어떤 단어를 가장 많이 사용할까?’ 카카오톡 대화 내역을 바탕으로 우리의 대화 방식을 분석해 시각적으로 정보를 제공해요.
- 📂 .csv 파일을 편집 없이 업로드하세요 카카오톡 내보내기 파일을 업로드 하기만 하세요! 최근 대화 내용을 기준으로 하이라이톡이 똑똑하게 분석해드릴게요. 대화 내용은 저장하거나 AI 학습에 활용하지 않고, 분석 후 곧바로 파기됩니다.
- 🔗 분석한 결과를 친구에게 공유하세요 분석한 결과를 친구에게 바로 공유해보세요. 클립보드에 URL을 복사하거나, 카카오톡 메시지를 바로 전송할 수 있어요.
- 💰 코인을 충전해 더 재밌는 유료 컨텐츠를 즐겨보세요 카카오페이 및 KG이니시스 일반 결제를 지원합니다. 회원가입 시 100 보너스 코인을 선물로 드려요! 보너스 코인으로 유료 컨텐츠를 즐겨보세요. (현재 결제 기능은 테스트중으로, 결제된 금액은 당일 자정에 환불됩니다.)
- 우리가 협업하는 규칙
- 커밋 컨벤션 : GitHub Wiki 참고
- 브랜치 컨벤션 : GitHub Wiki 참고
- 코드 컨벤션 : GitHub Wiki 참고
프론트엔드,팀장 | 프론트엔드 | 프론트엔드 |
---|---|---|
- 개발 환경
- 개발 언어:
TypeScript
- 패키지 매니저:
pnpm
- 린팅 & 포맷팅:
ESLint
,Prettier
- 부트스트랩:
create-next-app
- API Client:
Bruno
- 개발 언어:
- 클라이언트
- 프레임워크:
Next.js v.14
- 상태관리:
Zustand
- 스타일링:
SCSS(Module)
- 프레임워크:
- 백엔드
- API 서버:
Node.js + Express
- API 서버:
- 인프라
- 데이터베이스:
MongoDB Atlas
- 배포:
AWS EC2
- 데이터베이스:
├── 📁public
│ ├── 📁image # 이미지 파일 관리
│ └── 📁static # font등 정적 파일 관리
├── 📁src
│ ├── 📁app
│ │ ├── 📁(home) # 메인 페이지
│ │ ├── 📁(tests) # 분석 관련 페이지
│ │ ├── 📁(user) # 마이페이지, 로그인
│ │ ├── 📁api # Data Fetching
│ │ ├── 📁posts # 게시판
│ │ ├── 📜error.tsx
│ │ ├── 📜layout.tsx
│ │ ├── 📜loading.tsx
│ │ ├── 📜not-found.tsx
│ │ └── 📜providers.tsx
│ ├── 📜auth.ts
│ ├── 📁components # 공통 컴포넌트
│ ├── 📁data # 더미데이터
│ ├── 📁hooks # 커스텀 훅
│ ├── 📜middleware.ts
│ ├── 📁serverActions # 서버 액션
│ ├── 📁store # 전역 상태
│ ├── 📁styles # 공통 스타일 및 mixin
│ ├── 📁types # 재사용되는 타입
│ └── 📁utils # 유틸 함수
└── 📜tsconfig.json
원활한 실행을 위해서는 환경변수 파일(.env)이 필요합니다. 개발자에게 .env 파일을 요청하세요.
- Repository 로컬에 복제하기
먼저 Repository를 Clone하고 패키지를 다운로드합니다. 패키지매니저 pnpm이 필요합니다.(Link: pnpm Installation]
git clone https://github.com/FRONTENDSCHOOLPLUS2/HighlighTalk.git
pnpm install
- 패키지 설치가 완료되면 다음 명령어로 서버를 실행합니다:
npm run dev
# or
yarn dev
# or
pnpm dev
# or
bun dev
- 이후 브라우저에서 http://localhost:3000를 엽니다.
Link: https://www.highlightalk.site
카카오톡 대화 내용을 CSV 파일로 내보내면, 오랜 기간 축적된 대화의 양이 많아져 모델이 수용할 수 있는 텍스트 양을 초과하는 문제가 발생했습니다. CSV 데이터를 확인해보면, 말한 날짜, 시간, 이름, 대화 내용 등이 포함되는데, 이 데이터를 그대로 업로드하면 텍스트 양이 초과됩니다.
예를 들어, 카톡 메시지 한 건이 다음과 같은 형식으로 제공됩니다:
{”Time”:”2024-07-13 20:36:51 "User":"승혁🐵","Message":"잘자라"} 이처럼 불필요한 데이터가 포함된 상태에서는 모델의 입력 한도를 초과하기 쉽습니다.
API가 처리 할 수 있는 데이터 용량을 계산한 결과, 한글 문장으로 약 600~700문장을 처리할 수 있다고 판단했습니다. 따라서 시간 정보나 공백과 같은 불필요한 데이터를 제거하면, 더 많은 대화를 불러와 분석할 수 있다 결론 지었습니다.
이를 위해 CSV 파일을 업로드할 때, 자동으로 불필요한 데이터를 제거하는 가공 과정을 구현했습니다.
다양한 대화 내용에서 불필요한 정보를 가장 빠르게 제거하기 위해, 복잡한 조건 없이 사용할 수 있는 정규 표현식을 사용 했습니다.
// CSV 파일 내 필요없는 문자는 제거하는 정규표현식 함수
const removeDateTimeAndUserKey = (text: string): string => {
const dateTimeRegex = /"Date":"\d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2}",?/g;
const cleanedText = text.replace(dateTimeRegex, '').trim();
return cleanedText.replace(/,}/g, '}').replace(/,]/g, ']').trim();
};
export default removeDateTimeAndUserKey;
이 함수는 CSV 파일에서 파싱된 텍스트를 받아 처리하도록 설계되었습니다. 데이터 구조는 대화 내용이 어떤 경우에도 동일하기 때문에, "Date":"YYYY-MM-DD HH:MM:SS"
형식의 시간을 찾아 제거하고, trim()
메서드를 사용해 양쪽의 공백을 제거합니다.
함수를 사용한 결과, 다음과 같이 대화 내용이 간소화됩니다:
// string 형태
{ "Time": "2024-07-13 20:36:51", "User": "승혁🐵", "Message": "잘자라" }
{ "User": "승혁🐵", "Message": "잘자라" }
하나의 대화에서는 그 차이가 크지 않지만, 많은 대화 내용 속에서 중복된 데이터를 제거하면, 더 많은 대화를 분석할 수 있습니다.
예를 들어, 아래와 같은 결과를 얻을 수 있습니다:
제거 전 1 | 제거 후 2 |
---|
전체적으로 사용하던 토큰의 수가 같은 톡방의 경우 19,000토큰에서 5,700토큰으로
감소 비율 = (
19,000 - 13,000 ) × 100 ≈ 약 70%를 감소 시켰고 같은 대화방 내용을 더 많은 분량으로 분석할 수 있게 되어, 결과적으로 분석의 정확성을 높이고 더욱 효율적인 결과를 얻을 수 있었습니다.
AWS EC2를 통해, HTTP로 클라이언트 앱을 배포하였습니다. 그러나 HTTP 환경은 검색 엔진 우선순위 배정에 불이익이 있고, Clipboard API 사용이 불가능한 문제가 발생하여 배포 서버에 SSL 인증서를 적용하고자 하였습니다.
이를 위해 AWS Certification Manager를 통해 SSL 인증서를 발급받아 로드밸런싱을 적용했으나, 이후 https://highlightalk.site에 접근했을 때 "이 사이트는 보안 연결(HTTPS)이 사용되지 않았습니다" 경고가 발생하며 웹사이트에 접근이 불가능하다는 문제가 발생했습니다.
브라우저 경고에서 "인증서가 올바르지 않음"이라는 경고를 발견하고, 인증서가 잘 발급되었는지 ACM 대시보드를 재확인 하였습니다. 그 결과 인증서 발급 시 도메인 이름을 '*.highlightalk.site'으로 지정했기 때문에 서브도메인이 포함되지 않은 URL에서는 인증서가 유효하지 않다는 문제를 발견했습니다.
이후 Route53을 통해 www.highlightalk.site에 대한 호스팅 영역 레코드를 생성해줌으로써 인증서가 유효한 URL로 사용자가 접근 가능하도록 조치하였습니다.
문제 : 대화 내용이 민감한 정보를 포함할 수 있기 때문에, 이를 클라이언트에서 안전하게 전송하고 저장하는 과정에서 보안적인 이슈가 발생 했습니다.
과정은 이렇습니다.
- CSV 파일 업로드 및 데이터 처리: 트러블(5-1) 내용
- CSV 파일을 최적화 후, 파일의 데이터를 사용하여 GPT API와 (POST,GET) 통신할 필요가 있었습니다.
- API 선택 및 확장:
- 요구되는 동작을 제공하는 API 리소스가 없어, 기존의
posts API
를 사용해야 했습니다. - 이 API에서 사용할 수 있는 필드를 확인하는 과정에서
extra
라는 속성을 발견했습니다. extra
필드는 원하는 값을 저장할 수 있었으나, 결과 페이지에서 데이터를 조회해 결과를 생성해야 했기 때문에, GPT가 전송하는 값이 문자 형태가 아닌 JSON 형태로 파싱하여 서버에 전송하는 방법을 채택했습니다.
- 요구되는 동작을 제공하는 API 리소스가 없어, 기존의
- 동적 경로 처리:
- 문제점: AI 프롬프트가
pathname
에 따라 다르게 동작하도록 설계했으나, 클라이언트 컴포넌트에서 URL의pathname
을 가져오는 데 어려움이 있었습니다. - 해결 방법: 이 문제를 해결하기 위해 라우트 핸들러를 사용하여 경로를 생성했습니다. 클라이언트 측에서는
pathname
, 대화 내용, 프롬프트를 함께 라우트 핸들러 경로로POST
요청을 통해 전송했습니다. 서버에서는 이 데이터를 수신하여 필요한 처리를 한 후 데이터베이스에 저장했습니다. 이를 통해 데이터가 적절히 분류되고 보안 문제가 해결되었습니다.
- 문제점: AI 프롬프트가
- 테스트 결과 분류:
- 테스트 결과를 추후 쉽게 분리하기 위해, 테스트의 종류(
freetest
,lovetest
)를type
필드로 지정하여 전달했습니다. - GPT와의 통신 결과를
extra
필드에 포함시키고, 동적으로 생성된type
필드도 함께 서버로 전송했습니다. 이를 통해 서버 측에서 테스트 결과를 효과적으로 분류하고 관리할 수 있도록 했습니다.
- 테스트 결과를 추후 쉽게 분리하기 위해, 테스트의 종류(
- 보안 고려:
- 대화 내용에는 민감한 정보가 포함될 수 있기 때문에 보안에 신경을 써야 했습니다.
- 이 과정을 위해 라우트 핸들러를 사용하여 클라이언트 측에서
POST
요청을 통해 데이터를 서버로 전송하는 방식을 구현했습니다.
- 결과 페이지
- 이 후 서버에 게시물에 extra 속성으로 조회를 해서 원하는 결과 값을 가지고 화면을 표시 할 수 있게 됐습니다.
-
PR 후 적극적인 코드리뷰
-
실무와 유사한 개발 환경 조성을 위해 많은 시도
- 프로젝트 관리: GitHub 프로젝트와 마일스톤을 활용해 체계적인 개발 프로세스 관리.
- 문서화: Notion과 기술 노트뿐만 아니라 Figma, FigJam을 활용해 시각적인 자료와 함께 소통.
-
효율적인 협업을 위한 데일리 스크럼
- 효율적인 회의: 데일리 스크럼을 통해 문제를 빠르게 해결하고, 컴팩트한 회의 진행.
- 템플릿 활용: Notion 템플릿을 사용해 회의 내용을 신속하게 작성하고 공유.
- 문제 해결 접근법: 스크럼 후 추가적인 논의로 어려운 이슈 해결.
-
기술적인 도전과 성과
- 기술 학습: 공식 문서를 기반으로 AI, AWS, NEXT 등 새로운 기술들을 학습하고 도전.
- 비즈니스적 고민: UI 구현을 넘어 토큰 사용 최적화 등 비즈니스적인 측면에서의 고민도 함께 수행.
- 컨벤션 준수: 프로젝트 전반에서 코드 및 문서화 컨벤션을 철저하게 준수.
향후 버전 업데이트의 우선순위이며 에러가 발생하거나 추가해야 할 기능이 있을 경우 자율적으로 버전 업데이트 / 리팩터링을 진행합니다.
- 숨겨진
any
타입 잡아서 타입 커버리지 100% 달성 - 모바일 반응형 뷰 구현 미흡한 부분 수정
- 다양한 테마 상품을 구현 해볼 예정
- 정보 활용에 대해 유저가 이해할 수 있도록, 서비스에 대한 자세한 설명 추가
- 업로드된 파일의 분석 기준 안내
- 개인정보는 어떻게 활용되는지에 관한 내용
- 개발의 우선순위로 인해 넣지 않았던 기능들 추가
- 분석 테마 추가 확장
- EC2 t2.small → t2.micro 마이그레이션 위한 빌드최적화
-
다희: 현재 가지고 있는 AI 리소스 내에서 기획한 기능을 과정이 힘들기도 하면서, 수수께끼를 푸는 기분이 들어서 재미있는 경험이었습니다. 개인적으로 프론트엔드 영역에서의 과제 뿐 아니라 더 다양한 문제를 해결해보고자 하는 목표가 있었는데, 이번 프로젝트를 통해 클라우드 인프라를 어떻게 구성할 것인지에 관해 고민하고 학습해볼 수 있었습니다.
-
설하: GPT와 토큰 사용에 관하여 기획을 하면서 현실적인 부분들을 많이 고려할 수밖에 없었던 프로젝트지 않나 싶습니다. 기획의 결과 기능부터 구현하고 스타일을 입히는 방식이어서 다들 불안함이 많았을텐데, 아직 개선할 부분이 남아있다곤 하나 데모데이 기준 만족할 만한 결과물이 나와 기쁩니다. 로그인, 회원가입, 결제 등 유저와 관련한 파트를 일임해서 진행하였는데 처음에는 익숙하지 않은 영역이었지만 탄탄한 코드의 중요성과 그 역할을 깊이 이해하게 되었습니다.
-
우중: 이번 프로젝트를 통해 프론트엔드 개발의 범주를 넘어 기획과 디자인 등 다양한 분야를 경험할 수 있었습니다. 처음에는익숙하지 않은 영역이었지만, 점차 각 분야의 중요성과 그 역할을 깊이 이해하게 되었습니다프론트엔드 개발자로서 코드 구현에 집중하는 것뿐만 아니라, 전체적인 사용자 경험을 완성하는 데 기여할 수 있는 방안을 고민하게 되었습니다. 다양한 도전 과제를 해결하면서 성장할 수 있었지만, 여전히 부족한 부분도 많다는 것을 느낍니다. 예를 들어, 더 효율적인 협업 방법이나 코드 최적화에 대한 깊은 이해가 필요하다는 것을 깨달았습니다.