서버를 두개를 두는 이유
📘 독초 판별 서비스(POISON)
지금까지 여러가지 프로젝트를 하면서 정말 많이 배웠다고 생각하는데, 막상 기술들을 물어보거나 기술들을 왜 썼는지 물어보면 말을 잘 못할때가 있다. 면접준비을 보면서 느꼈고, 이 기회에 지금까지 한 프로젝트를 정리하면서 다시 공부하는 시간을 가져야 겠다고 생각했다. 중점으로 볼것은 그 기술을 왜 선택하게 되었는지, 그 기술을 선택함으로 얻는 이점이나 효과에 대해 정리해볼 예정이다. 내가 처음 한 프로젝트 독초 판별 서비스(POISON)에 대해 정리해보겠다.
서비스 내용
이미지를 업로드 하면 AI가 식물중 가장 비슷한 식물을 판별한 후 사용자에게 알려주는 서비스 또한 학습된 식물들의 리스트 및 식물 정보를 볼 수 있는 페이지(도감리스트 전체를 로딩하는것이 아닌 무한스크롤을 통해 필요한 만큼의 데이터 로딩) 도감에 등록된 식물을 검색할 수 있고, 판별 결과로 많이 조회된 순으로 랭킹을 보여주는 기능도 추가 총 3가지의 중요한 기능이 있다. 기능들을 설명하기 보단 이 기술을 왜 썼는지 이유를 정리해보자.
백엔드 서버가 두개
우리는 백엔드 서버를 두개를 두었다. Django는 데이터베이스와 프런트엔드 간의 통신을 관리하는 메인 백엔드 서버와 AI결과보고 및 AI모델이 있는 Flask서버 두개가 있다. ORM(Object-Relational Mapping),많은 내장 기능을 제공표준 웹 애플리케이션의 신속한 개발에 적합하고 프런트 엔드와 데이터베이스 간의 일반적인 데이터 흐름을 처리하는 데 매우 적합하기때문에 메인 백엔드 서버는 Django로 두었고, Flask의 단순성과 가벼운 특성으로 인해 집중적인 마이크로서비스를 구축하는 데 이상적이어서 AI서버로는 Flask서버로 두었다.
이렇게 백엔드 서버를 두개를 만든 이유가 무었일까?
백엔드 서버를 두개를 둔 이유
-
관심사 전문화 및 분리 AI서버와 프론트엔드 간의 통신을 관리하는 메인서버 두개를 분리하여 각각 서버의 관심사를 분리할수있다.
-
확장성
메인 백엔드 서버(Django)를 AI 서버(Flask)에서 분리하면 특정 리소스 요구 사항에 따라 이러한 구성 요소를 독립적으로 확장할 수 있다. 예를 들어 AI 관련 작업이 리소스 집약적인 경우 기본 백엔드 서버에 영향을 주지 않고 Flask 서버에 추가 리소스(예: 컴퓨팅 성능, 메모리, 스토리지)를 할당할 수 있다.
- 기술 스택 유연성
애플리케이션의 구성 요소마다 기술 스택 요구 사항이 다를 수 있다. Django와 Flask를 사용하면 종속성과 라이브러리를 유연하게 선택할 수 있다. 이러한 분리를 통해 각 백엔드 서버에 가장 적합한 기술 스택을 선택하여 각 구성 요소의 개발 및 성능을 최적화할 수 있다.
- 모듈화 및 유지 관리성
백엔드를 두 개의 서버로 나누면 모듈화가 촉진된다. AI 관련 기능에 대한 변경이나 업데이트를 Flask 서버로 격리하여 기본 백엔드 서버에 영향을 미칠 위험을 줄일 수 있다. 이러한 분리로 인해 유지 관리성이 향상되고 시스템의 다양한 부분을 더 쉽게 이해하고 관리할 수 있다.
S3사용 이유
데이터베이스에 사진을 담기 위해 무엇을 쓸지 고민하다 쓴것은 S3이다. 데이터베이스에 사진 그 자체가 들어가게 되면 용량이 너무 커버리게 된다. 이때 S3를 사용하여 이미지의 url을 s3 bucket에 저장하여 데이터베이스에는 사진이 아닌 url을 저장하였다.
검색엔진을 사용한 이유
우리가 꽃을 검색할때 “진달래”를 치고싶은데 100이면 100번을 “진달래”로 치는것이 아니고 “진달레”, “진덜래” 이런식으로 오타가 생기기 마련이다. 이런 사용자 경험을 개선시키고자 MongoDB Atlas Search를 사용하여 꽃 이름 유사어 검색 및 다중검색이 가능하도록 검색엔진을 구현하였다.
비동기 처리
이 프로젝트에서는 사용자가 사진을 올리면 그 사진이 독초인지 아닌지 판별하는 기능에 비동기 처리 방식을 썼다. 예를 들어서 여러 개의 수신 HTTP 요청을 동시에 처리해야 하는 웹 서버가 있다. 비동기식 처리가 없으면 서버는 한 번에 하나의 요청을 처리할 수 있으므로 응답 시간이 느려지고 병목 현상이 발생할 수 있다. 비동기식 처리를 통해 서버는 요청을 동시에 처리하여 전반적인 성능을 향상시킬 수 있다. 이 프로젝트를 예를 들어, 들어오는 각 사진을 서버에 처리 요청을 트리거한다. 비동기식 처리를 통해 서버는 여러 요청을 동시에 처리할 수 있으므로 한 사용자로 인해 다른 사용자의 메시지 처리가 지연되지 않게 설계한것이다.
비동기 처리를 통해 서버는 리소스를 효율적으로 활용할 수 있다. 예를 들어 하나의 메시지 요청에 시간이 걸리는 데이터베이스 쿼리 또는 외부 API 호출이 포함된 경우 서버는 대기 기간 동안 다른 요청 처리로 전환하여 리소스가 유휴 상태가 되지 않도록 할 수 있다.
폴링 방식
이 시나리오의 폴링 방법은 사진 분석 작업의 진행 상황을 추적하고 사용자 인터페이스를 업데이트하거나 작업 완료에 따라 특정 작업을 트리거하는 데 유용할 수 있다. 서버가 여러 사진 요청을 비동기적으로 처리할 수 있게 하며, 폴링 방법을 통해 각 분석이 완료되는 시점을 추적하여 사용자에게 적시에 응답하거나 알림을 보낼 수 있다. 예를 들어, 사용자가 사진을 업로드하면 분석을 위한 비동기 처리가 시작된다. 서버는 사진 분석을 시작하고 요청을 차단하는 대신 분석이 진행 중임을 사용자에게 즉시 응답한다. 이후 폴링 방식을 통해 진행 중인 분석 상태를 주기적으로 확인합니다. 분석이 완료되면 서버는 사용자 인터페이스를 업데이트하고 사용자에게 결과를 알리거나 필요에 따라 다른 조치를 취할 수 있다.
Celery 작업 상태를 지속적으로 확인하기 위한 전략적 폴링 방법을 구현했다. 이 접근 방식을 사용하면 진행 중인 작업을 처리하는 동안에도 서버가 계속 응답하고 새로운 요청을 처리할 수 있으므로 전체 시스템 효율성이 향상된다.
우리는 이 프로젝트에서 사용자가 사진이 독초인지 아닌지 판단하기 위해 웹사이트에 요청을 하면 AI가 판단하기 전까지 로딩을 기다려야했다. 하지만 이러한 폴링 구조를 활용하여 AI가 판단하도록 시키고 다른 것들(랭킹,도감)을 살펴보고있을때 판단이 끝났다고 알람이 보내던가 할 수 있게 확장성있게 하기위해 폴링 구조를 활용하였다.