본문 바로가기
  • AI 개발자가 될래요

Category151

[논문 요약] Sound Source Localization is All about Cross-Modal Alignment [논문 요약] Sound Source Localization is All about Cross-Modal Alignment  https://arxiv.org/pdf/2309.10724 Abstract인간은 이미지에서 소리의 근원지를 쉽게 알 수 있다. 이 task를 "sound source localizaion"이라 칭한다.이 논문은 SOTA localization 성능을 보여주는 audio-visual cross-modal semantic understanding 기법을 소개한다. 1. Introduction인간은 쉽게 소리의 근원지를 알 수 있으며, 이벤트를 쉽게 이해할 수 있다.인간의 인식 기법에 착안한 기존의 모델들은 audio와 visual 신호에 상관이 있다고 가정했다.이 가정을 기반한 여러 .. 2024. 8. 7.
[자율주행] 다중센서기반 물체 탐지/인식 기술 조사 [자율주행] 다중센서기반 물체 탐지/인식 기술 조사 관련 기술에 대한 논문을 읽고 배경지식 / 중심 내용 발췌 정리 1. 열악한 환경에서의 자율주행을 위한 다중센서 데이터셋 구축https://jkros.org/_common/do.php?a=full&b=33&bidx=3021&aidx=33759 Journal of Korea Robotics Society[ ARTICLE ]The Journal of Korea Robotics Society - Vol. 17, No. 3, pp. 245-254 Abbreviation: J. Korea Robot. Soc.ISSN: 1975-6291 (Print) 2287-3961 (Online) Print publication date 31 Aug 2022 Received .. 2024. 5. 27.
[주관적 논문 내용 정리] Collaborative Diffusion for Multi-Modal Face Generation and Editing [주관적 논문 내용 정리] Collaborative Diffusion for Multi-Modal Face Generation and Editing https://arxiv.org/abs/2304.10530 Collaborative Diffusion for Multi-Modal Face Generation and EditingDiffusion models arise as a powerful generative tool recently. Despite the great progress, existing diffusion models mainly focus on uni-modal control, i.e., the diffusion process is driven by only one modality of c.. 2024. 5. 21.
[Linux/Ubuntu] 우분투 버전 확인 명령어 [Linux/Ubuntu] 우분투 버전 확인 명령어  lsb_release -a 2024. 5. 14.
[논문 리뷰] Effective Adapter for Face Recognition in the Wild [논문 리뷰] Effective Adapter for Face Recognition in the Wild https://arxiv.org/abs/2312.01734 Effective Adapter for Face Recognition in the WildIn this paper, we tackle the challenge of face recognition in the wild, where images often suffer from low quality and real-world distortions. Traditional heuristic approaches-either training models directly on these degraded images or their enhanced count.. 2024. 4. 30.
[얼굴 인식/Face Recognition] 얼굴 인식 관련 참고 자료 내가 보려고 만든 얼굴 인식(Face Recognition) 관련 참고 자료 지극히 주관적으로 필요한 자료들을 모아놓은 글. 1. 얼굴 인식 학습에 자주 사용되는 데이터셋  출처: https://arxiv.org/pdf/1804.06655 2. 얼굴 인식 TECHNICAL CHALLENGES(기술적 한계) • Security issues. Presentation attack [289], adversarial attack [280], [281], [290], template attack [291] and digital manipulation attack [292], [293] are developing to threaten the security of deep face recognition systems... 2024. 4. 29.