잡것/STT

잡것/STT

[STT][Whisper설치과정] #2 ffmpeg , whisper 설치하기

1. 시작 아래 링크에서 이어서 작성된 글입니다. [참고 : Python, NVIDIA CUDA, PyTorch 설치하기] https://hbcha0916.tistory.com/72 [STT][Whisper설치과정] #1 Python, NVIDIA Driver, PyTorch 설치하기 1. 시작 Whisper를 사용하기 위해 우선 그래픽 드라이버 및 PyTorch를 설치한다. 1.1. 설치 버전 Whisper를 사용하기 위해 아래와 같은 버전을 사용합니다. 아래와 같은 버전이 아닐 경우 2번으로 넘어가 hbcha0916.tistory.com 1.1. FFmpeg란 요약 FFmpeg는 인간과 기계가 만든 거의 모든 것을 디코딩, 인코딩, 트랜스코딩, 믹스, 디믹스, 스트리밍, 필터링 및 재생할 수 있는 선..

잡것/STT

[STT][Whisper설치과정] #1 Python, NVIDIA Driver, PyTorch 설치하기

1. 시작 Whisper를 사용하기 위해 우선 그래픽 드라이버 및 PyTorch를 설치한다. 1.1. 설치 버전 Whisper를 사용하기 위해 아래와 같은 버전을 사용합니다. 아래와 같은 버전이 아닐 경우 2번으로 넘어가 설치합니다. 1.1.1. Python 버전 3.9.0 (최신버전으로 사용해도 무관) 아래 명령어로 Python 버전을 확인합니다. python --version 1.1.2. CUDA 버전 11.8 아래 명령어로 CUDA 버전을 확인합니다. nvcc --version 1.1.3. PyTorch CUDA 11.8 아래 명령어로 CUDA 버전을 확인합니다. python # python 콘솔 진입 >>> import torch >>> print(torch.__version__) >>> exit..

잡것/STT

[STT] Whisper와 ClovaSpeech

1. 시작 STT관련 프로젝트 덕분에 STT를 알게 되었다. STT는 Speech To Text의 줄임말로 사람의 음성을 텍스트로 변환한다. 반대로는 TTS(Text To Speech)가 있으며 우리가 알고 있는 BJ한테 후원하면 나오는 여자음성(and 쿠쿠루삥뽕), 내비게이션 길안내 등이 TTS이다. 2. STT종류 및 특징 STT를 사용해 볼수 있는 것은 OpenAI(ChatGPT를 만든 조직)에서 만든 Whisper와 Naver에서 만든 ClovaSpeech가 있다. 2.1. OpenAI - Whisper 주요 특징 [참고 : whisper github] https://github.com/openai/whisper GitHub - openai/whisper: Robust Speech Recognit..

항상 빌드중
'잡것/STT' 카테고리의 글 목록