본문 바로가기
  • AI 개발자가 될래요

Deep Learning20

[기술 정리] Speaker Recognition, 화자 인식에 대한 조사 및 알아둘 내용 정리 노트 연구를 위한 기술 조사 과정에서 개인적으로 알아두면 좋을 것 같은 내용을 정리한 문서. 논문 조사A review on speaker recognition: Technology and challengeshttps://www.sciencedirect.com/science/article/pii/S00457906210003182021년도 서베이 논문- Human speech can provide much information as the human voice forms a vital characteristic of an individual. Accent, language, speech, emotion, gender, and the speaker’s identity are some of the informatio.. 2025. 3. 13.
TensorFlow Lite(TFLite) vs TensorRT 비교 TensorFlow Lite(TFLite) vs TensorRT 비교 두 기술 모두 AI 모델을 최적화하여 경량화 및 속도 향상을 목표로 하지만, 사용 목적과 동작 방식이 다르다. TensorFlow Lite (TFLite)TensorRT주요 목적모바일 및 엣지 디바이스에서 AI 모델을 위한 경량화NVIDIA GPU에서 딥러닝 모델을 최적화하여 실행 속도 향상지원 플랫폼Android, iOS, Raspberry Pi, 마이크로컨트롤러 등NVIDIA GPU 기반 시스템 (Jetson, 서버 GPU 등)모델 변환 방식Float → Quantization (8-bit, FP16)으로 변환, 경량화FP32 → FP16 또는 INT8 변환으로 속도 향상하드웨어 가속CPU, Edge TPU, GPU, DSP 등 다.. 2025. 2. 27.
[에러 고치기] pip._vendor.urllib3.exceptions.ReadTimeoutError: HTTPSConnectionPool(host='files.pythonhosted.org', port=443): Read timed out. 에러 [에러 고치기] pip._vendor.urllib3.exceptions.ReadTimeoutError: HTTPSConnectionPool(host='files.pythonhosted.org', port=443): Read timed out. 에러 문제 상황pip로 wandb 모듈을 설치하려다 생긴 에러다. 문제 원인기본적으로 pip는 일정 시간 동안 응답이 없으면 타임아웃이 발생하는데,wandb를 다운받는 어떤 서버에서 일정 시간 동안 응답이 없어 타임아웃이 발생한 것이었다. 해결 방법pip install wandb --timeout=100 타임아웃 시간을 명시적으로 늘려서 수정 가능하다. 결과설치가 잘 되었다. 2025. 2. 25.
[PyTorch/Python] conda list의 torch 버전과 pip show torch 버전이 다를 때 [PyTorch/Python] conda list의 torch 버전과 pip show torch 버전이 다를 때 pip show torch에 출력된 파이토치 버전과 conda list로 출력된 파이토치 버전이 다를 때 해결법이다. 1. 문제 상황파이토치를 설치했고, conda list 로도 출력이 되는데 no module name 'torch' 에러가 자꾸 떴다. 1.1 pip torch 버전 확인pip show torch위의 명령어로 torch 버전을 확인해보니 아래처럼 나왔다.Name: torchVersion: 2.2.1Summary: Tensors and Dynamic neural networks in Python with strong GPU accelerationHome-page: https://.. 2025. 2. 21.
[pytorch/분산처리/디버깅노트] 배치사이즈 주의점 / 배치사이즈가 1일 때 분산처리 주의사항 / 에러 원인 및 해결방법 [pytorch/분산처리] 배치사이즈 주의점 / 배치사이즈가 1일 때 분산처리 주의사항 / 에러 원인 및 해결 방법 인고의 디버깅 끝에 알아낸 문제와 해결 과정 및 방법. 1. 문제현재 어떤 오픈소스 모델 학습 중에 있는데, 건드린게 없는데도 학습 시 에러가 발생했다.audio = audio.view(-1, 5, audio.shape[-1]) # [B, T, 128]RuntimeError: shape '[-1, 5, 128]' is invalid for input of size 256 해석하자면 audio 변수를 [b, 5, 128] 형태로 바꿀 수 없다는 것이다.audio 변수는 코드상으로는 [b*5, 128] 형태이기 때문에, [b, 5, 128]으로 당연히 바꿀 수 있는 것이었다. 그러나 특정 구간.. 2025. 2. 18.
[데이터셋 조사] Audio-Visual 데이터셋 조사 [데이터셋 조사] Audio-Visual 데이터셋 조사  LRS3This dataset introduced by Afouras et al. exclusively comprises of real videos. It consists of 5594 videos spanning over 400 hours of TED and TED-X talks in English. The videos in the dataset are processed such that each frame contains faces and the audio and visual streams are in sync.https://mmai.io/datasets/lip_reading/ Explore -->" data-og-host="mmai.io" d.. 2024. 11. 20.