생성형 AI, 이미지 합성, 자동화된 이미지 이해에 깊은 전문성을 가진 컴퓨터 비전 연구원이자 AI 개발자입니다. 이미지 생성, 세그멘테이션, 객체 감지, 이미지 간 변환과 같은 작업을 위한 딥러닝 아키텍처 설계, 학습 및 배포에 전문성이 있습니다. PyTorch와 TensorFlow를 포함한 고급 프레임워크에 능숙하며, 신경망, GAN, 디퓨전 모델, 비전 트랜스포머에 대한 실무 경험이 있습니다. 제 연구는 기술적 혁신과 실제 응용을 통합합니다.
시스템 소프트웨어 연구실, 숭실대학교 — 서울, 대한민국
2022년 9월 – 현재Cubix — 카라치, 파키스탄
2022년 2월 – 2022년 8월43개의 필기 샘플만으로 2,780개의 한글 문자를 생성하는 시스템 개발. YOLOv8을 활용한 효율적인 문자 감지 및 세그멘테이션, PACGAN을 통한 고품질 폰트 스타일 합성.
기술: YOLOv8, GANs (PACGAN), PyTorch, 한글 폰트 생성
프로젝트 보기 (mywriting.kr)스타일 블렌딩을 통한 필기체 품질 향상을 위한 GAN 기반 모델 개발. MDPI Electronics에 게재. 스타일 전송을 위한 새로운 융합 기술 구현.
기술: GANs, 스타일 전송, 컴퓨터 비전, 연구
논문 보기
실시간 객체 감지에 대한 이해를 높이기 위해 오픈소스 프로젝트에 참여하고 직접 실행했습니다. 이 시스템은 YOLOv8과 OpenCV를 활용하여 실시간 영상 스트림에서 여러 객체를 감지 및 추적하며, 경고 및 이벤트 로깅 기능을 포함합니다.
기술: YOLOv8, OpenCV, Python, 딥러닝
기술: YOLOv8, OpenCV, Python, 딥러닝
오픈소스 보기 (Ultralytics YOLO)
의료 영상 분할 실습을 위해 오픈소스 프로젝트를 활용했습니다. U-Net 기반 모델을 사용하여 MRI 영상에서 종양을 정밀하게 분할하고 진단 지원에 기여했습니다.
기술: U-Net, 의료 영상, PyTorch
기술: U-Net, 의료 영상, PyTorch
오픈소스 보기 (Brain Segmentation)
Vision Transformers(ViT)를 활용한 정밀 분류 오픈소스 프로젝트를 직접 실행했습니다. 전이학습과 데이터 증강을 통해 유사한 조류 종을 구분하는 파이프라인을 구축했습니다.
기술: Vision Transformers, 이미지 분류, PyTorch
기술: Vision Transformers, 이미지 분류, PyTorch
오픈소스 보기 (ViT)
자율주행을 위한 의미론적 세그멘테이션 역량 강화를 위해 오픈소스 프로젝트에 기여했습니다. DeepLabV3+ 모델로 도로 차선, 차량, 보행자 등을 인식합니다.
기술: DeepLabV3+, 의미론적 세그멘테이션, TensorFlow
기술: DeepLabV3+, 의미론적 세그멘테이션, TensorFlow
오픈소스 보기 (DeepLab)
항공 드론 영상에서 다중 객체 탐지 시스템을 개발하기 위해 오픈소스 프로젝트를 활용했습니다. Faster R-CNN을 사용하여 고해상도 이미지에서 건물, 차량, 인프라를 탐지합니다.
기술: Faster R-CNN, 항공 영상, 딥러닝
기술: Faster R-CNN, 항공 영상, 딥러닝
오픈소스 보기 (Faster R-CNN)Cubix에서 개발한 블록체인 기반 게임 플랫폼. Solidity를 활용한 스마트 컨트랙트 통합 및 Node.js 기반 백엔드 API 개발. 게임 내 거래의 투명성과 보안을 강화했습니다.
기술: 블록체인, 스마트 컨트랙트, Solidity, Node.js
상세보기Avinash Kumar, Irfanullah Memon, Abdul Sami, Youngwon Jo, Jaeyoung Choi
Electronics, 14(13), 2699, 2025
논문 보기Abdul Sami, Avinash Kumar, Youngwon Jo, Irfanullah Memon, Muhammad Rizwan, Jaeyoung Choi
ICOIN 2025, 치앙마이, 태국, 2025
논문 보기Youngwon Jo, Avinash Kumar, Uijong Yang, Daeun Kim, Jaeyoung Choi
한국어문학회 연례 학술대회, 2024, p 50-55
논문 보기Avinash Kumar, Irfanullah Memon, Abdul Sami, Youngwon Jo, Jaeyoung Choi
SSRN, 2024
초록 보기Avinash Kumar, Kyeolhee Kang, Ammar ul Hassan, Jaeyoung Choi
MDPI Electronics, 2023
논문 보기Hyston Kayange, Avinash Kumar, Yejung Lee, Hoonseo Jung, Jongsun Choi
한국정보과학회, 2023
논문 보기Avinash Kumar, Kyeolhee Kang, Ammar ul Hassan, Jaeyoung Choi
MITA 2023, 체코 오스트라바 공과대학, 2023
논문 보기2025.04.11 | 출원 (10-2025-0047215, submitted)
발명자: Jayoung Choi, Irfanuulah Memon, Avinash Kumar
2025.04.08 | 출원 (10-2025-0045652, submitted)
발명자: Jayoung Choi, Avinash Kumar
2025.03.18 | 출원 (10-2025-0034957, submitted)
발명자: Jayoung Choi, Irfanuulah Memon, Avinash Kumar, Youngwon Jo
2025.03.17 | 출원 (10-2025-0034154, submitted)
발명자: Jayoung Choi, Avinash Kumar, Youngwon Jo
MITA 학회 2023
GAN을 활용한 폰트 개선에 대한 혁신적인 연구로 수상
숭실대학교 (2022-2024)
석사 학위 과정을 위한 교수 장학금 수혜
도쿄대학교, 일본 (2018)
사이버 보안 해커톤 참가를 위한 최우수 학생 선발
메란 공과대학교 (2016-2021)
학사 학위 과정을 위한 고등교육위원회 장학금 수혜
GAN, 디퓨전 모델, 신경 스타일 전송, 텍스트-이미지 합성, 이미지 생성, 폰트 생성
이미지-이미지 변환, 문서 분석, 객체 감지, 이미지 분류, 의미론적 세그멘테이션
텍스트 조건부 이미지 생성, 크로스모달 검색, 비전-언어 모델
저는 생성형 AI와 컴퓨터 비전 분야의 도전적인 문제들을 해결하기 위한 새로운 딥러닝 기술 개발에 특히 관심이 있습니다. 현재 연구는 생성된 이미지의 품질과 다양성 향상, 생성 모델의 성능 개선, 그리고 비전과 언어의 교차점 탐구에 초점을 맞추고 있습니다.