🍼

MILK: The Most Innovative Way to Learn Korean

Abstract

Word Embedding (FastText) 기반의 한국어 문맥 추론 퀴즈이다.
개별 단어의 Representation Vector를 Pretrained된 FastText모델을 이용해 구하고, 그렇게 얻어진 단어들의 Representation Vector의 평균 Vector를 주어진 Context를 Represent할 수 있는 Context Vector라고 보고, Context를 구성하는 단어의 Vector들 중 Context Vector와 Cosine Similarity가 가장 높은 단어를 빈칸으로 생성한다. 선지에는 k-Neareast Neighbor 알고리즘을 이용해 해당 단어의 Vector와 벡터 공간 상에서 비슷한 위치에 위치하는 단어들을 선지로 출제해 문항의 난이도를 높이고 학습자로 하여금 미묘한 단어의 어감과 문맥을 조합할 수 있도록 하였다.
2021 SKKU AI-교육 해커톤에서 1박 2일 동안 개발하여 1.0 버전을 개발하였고, 2021 성균관대 사범대학 AI-SW 캡스톤 디자인 경진대회에 출품하기 위해 2.0 버전을 개발하였다.

Tech Stack

React, Styled-Components, MUI
FastAPI, Jupyter,Docker, MariaDB

My Work

Research
FastText 모델을 이용한 퀴즈 제작 연구
User Evaluation을 통한 평가 및 가설 정당화
Development
Docker Container, MariaDB, Jupyter를 이용해 문항 생성 및 개발 파이프라인 설계 및 구축 (1.0)
컴퓨팅 파워(M1 맥북, 시놀로지 서버)의 성능을 고려하여 MSA 설계로 문항 개발 및 문항 서빙 파이프라인 구축
Flask를 이용한 API 개발 (1.0)
FastAPI로 API 마이그레이트 및 API 개발 (2.0)
React를 이용한 SPA 어플리케이션 개발 (2.0)
Styled-Components, MUI를 이용한 디자인 구현 (2.0)
Design
Material Design 2.0 을 고려한 디자인 설계