프로젝트4 영화 추천 시스템 (4) - BERT와 GAT를 활용한 추천 모델 개발하기 이번 글에서는 BERT와 GAT를 결합하여 개발한 영화 추천 시스템 모델에 대해 자세히 설명하고자 한다. 기술적 의사결정BERT를 선택한 이유영화 추천에 있어서 중요한 요소 중 하나가 바로 영화의 내용을 얼마나 잘 이해하고 표현하는지이다. 기존의 단순한 장르 기반 추천이나 협업 필터링의 한계를 극복하기 위해, 영화의 줄거리와 제목에 담긴 의미를 정확하게 포착할 수 있는 BERT를 선택하였다. 특히 'bert-base-multilingual-cased' 모델을 채택한 이유는 다음과 같다. 다국어 지원을 통해 한글과 영어가 섞여 있는 데이터 처리 가능문맥을 고려한 양방향 인코딩으로 더 풍부한 의미 표현WordPiece 토크나이저를 통한 미등록 단어(OOV) 문제 해결GAT 도입 배경BERT만으로는 영화들 .. 2024. 12. 23. 영화 추천 시스템 - (3) Docker Compose를 이용하여 React + Django 개발환경 구축하기 https://antraxmin.tistory.com/102이 글을 쓰고 있는 시점에도 TMDB 영화 상세 데이터 수집은 여전히 진행중이다. 7시간 동안 18%이면.. 100% 채우는데 1~2일 더 걸릴 가능성이 커서 적당한 수준에서 타협하고 전처리 로직을 변경하던지 해야 할 것 같다. 이번 포스팅에서는 개발환경에서 Docker Compose를 사용해 리액트 프론트엔드와 장고 백엔드를 동시에 실행하는 방법을 다룰 것이다. Docker Compose 작동 원리 Docker Compose는 다중 컨테이너 애플리케이션의 정의와 실행을 관리하는 도구로, YAML 파일을 통해 서비스, 네트워크, 볼륨을 선언적으로 구성한다. 개발 환경에서 Docker Compose는 프론트엔드와 백엔드 컨테이너를 독립된 네트워크.. 2024. 12. 16. 영화 추천 시스템 - (2) React + Django CI/CD 파이프라인 및 AWS 아키텍처 설계하기 https://antraxmin.tistory.com/102 앞선 글에서 TMDB 영화 데이터를 가져오는 과정이 상당히 오래 걸렸다. 그래서 우선 웹 애플리케이션 세팅 먼저 해놓는게 좋을 것 같았다. 영화 추천 시스템의 프론트엔드는 React로, 백엔드는 Django로 구축할 계획이고, AWS 리소스와 통합하여 CI/CD 자동화 파이프라인을 먼저 만들어놓고자 한다. 기술적 의사결정 - 왜 리액트와 장고인가? 우선 프로젝트 요구사항에 반드시 웹서비스 형태로 만들어야 한다는 조건은 없었다. 그러나 개인 맞춤형 영화 추천 기능을 구현하려면 어떻게든 사용자와 상호작용하는 부분이 있어야 하는데, 아무리 생각해도 웹 인터페이스와 통합하는 방법밖에 떠오르지 않았다. 일단 웹서비스 형태로 만든다는 것을 가정하고 기술.. 2024. 12. 16. 영화 추천 시스템 - (1) TMDB API를 활용한 영화 데이터 수집 파이프라인 구축하기 이번 학기 딥러닝 과목 기말 프로젝트로 AWS를 활용한 개인 맞춤형 영화 추천 시스템을 개발하게 되었다. 전체적인 프로젝트 진행은 데이터 수집 및 전처리 - 모델 개발 - 모델 서빙 - 웹 인터페이스 통합 순으로 진행할 예정이다. 가장 먼저 데이터 수집 및 전처리 단계부터 시작하려고 한다. 영화 추천 AI 모델 개발을 위해서는 양질의 영화 데이터가 필수적이기에, 이번 글에서는 TMDB API를 활용하여 대량의 영화 데이터를 자동으로 수집하는 시스템을 어떻게 설계하고 구현했는지에 대해 자세히 공유하고자 한다. 본 시스템은 크게 두 가지 주요 기능으로 나뉜다. 첫 번째는 인기 영화 목록을 수집하는 것이고, 두 번째는 각 영화의 상세 정보를 가져오는 것이다. 이를 위해 requests 라이브러리를 사용하여.. 2024. 12. 16. 이전 1 다음