[음성] 구글 음성 인식 API 설정하기

êµ¬ê¸ ìì± ì¸ì APIì ëí ì´ë¯¸ì§ ê²ìê²°ê³¼ 


안녕하세요. 양재동 메이커 입니다.


얼마전 진행 하였던 G.Camp의 Google AI Speaker(STT) x LoRa Environment Control의 박형준님의 자료를 바탕으로 관련 내용을 다시 정리하였습니다.


깃헙 : https://github.com/DevHyung/LoRa-AISpeaker-seminar
로라예제 : https://github.com/codezoo-ltd/SNIPE 


* 구글 API등록 시 신용카드 번호 등록 이 필요하며 동영상을 제외한 음성 인식은 60분 무료



1. Python 3.x 설치


2. 패키지 설치


3. Cloud Speech API 키 발급 받기


4. 구글 SDK 설치


5. 구글 예제 코드



1~4. 설치 과정


첨부 파일을 참조하여 진행 문제 발생시 댓글 남겨 주시면 첨언 하겠습니다.


5. 구글 예제 코드


예저 다운로드 https://github.com/GoogleCloudPlatform/python-docs-samples/tree/master/speech/cloud-client

또는 Download Zip에서 파일 다운로드 https://github.com/GoogleCloudPlatform/python-docs-samples 



transcribe_streaming_mic.py 코드에서 인식 언어 변경


language_code = N'en-US'  # a BCP-47 language tag 에서

language_code = N'ko-KR'  # a BCP-47 language tag 변경


def main():
# for a list of supported languages.
language_code = 'ko-KR' # a BCP-47 language tag

client = speech.SpeechClient()
config = types.RecognitionConfig(
encoding=enums.RecognitionConfig.AudioEncoding.LINEAR16,
sample_rate_hertz=RATE,
language_code=language_code)
streaming_config = types.StreamingRecognitionConfig(
config=config,
interim_results=True)

with MicrophoneStream(RATE, CHUNK) as stream:
audio_generator = stream.generator()
requests = (types.StreamingRecognizeRequest(audio_content=content)
for content in audio_generator)

responses = client.streaming_recognize(streaming_config, requests)

# Now, put the transcription responses to use.
listen_print_loop(responses)


python sound_recorder.py


이제 마이크 테스트 해보시면 됩니다.  

마이크에 직접 말한 소리는 인식을 하는데 동영상의  소리는 인식을 못함


# Audio recording parameters
RATE = 16000
CHUNK = int(RATE / 10) # 100ms
#os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = "C:\\Users\\\\Downloads\\google-your-key.json"


혹, 구글 인증 키 동작 하지 않을 경우 #os.enviro에서 #에 제거 후 구글 인증 key 정보를 넣어 주시면 됩니다.

0
0
이 글을 페이스북으로 퍼가기 이 글을 트위터로 퍼가기 이 글을 카카오스토리로 퍼가기 이 글을 밴드로 퍼가기

인공 지능

번호 제목 글쓴이 날짜 조회수
15 일반 Universal Manipulation Interface icon HellMaker 05-13 3,366
14 일반 구글 미디어 파이프를 손 인식 및 아두이노 로봇 제작 icon 양재동메이커 07-27 6,857
13 일반 허스키 렌즈 자료 링크 icon 양재동메이커 06-18 11,482
12 일반 허스키 렌즈 _ 내부 죠커메이커 06-05 10,939
11 일반 허스키 렌즈 개봉기 _ 외부 +1 죠커메이커 06-05 9,236
10 일반 왜 인공지능이 화두일까 죠커메이커 06-03 9,124
9 일반 젝슨 나노에 대한 이야기 죠커메이커 06-01 8,671
8 일반 오픈캣을 AI 를 장착하기 위한 단계 죠커메이커 05-31 9,116
7 일반 AI 고양이와 현재 진행중인 고양이 프로젝트에 관해서 죠커메이커 05-31 9,361
6 일반 허스키 렌즈에 관한 궁금중에 대한 내용 죠커메이커 05-31 11,649
5 일반 허스키 렌즈란? 죠커메이커 05-31 10,934
4 음성 모기 소리 인식 - Prologue +1 icon 양재동메이커 04-05 12,602
3 음성 Kaldi Speech Recognition Toolkit icon 양재동메이커 02-19 15,379
2 일반 인공지능을 활용한 2D 이미지의 확대 프로그램 +1 icon 양재동메이커 02-10 14,483
1 음성 구글 음성 인식 API 설정하기 icon HelloMaker 02-02 13,751