Add support for websocket server to start_speech_recog #80

MayamaTakeshi · 2024-03-07T21:56:06Z

Similar to #79.
We could implement support for example to local whisper transcription but I usually run sip-lab in low-end VMs with limited resources.
Instead we can just establish a WebSocket connection to Speech Server and stream audio to it. Then we can use any STT engine like gsr, whisper etc.

The function call would be like this:

sip.call.start_speech_recog(call_id, {
  server_url: 'ws://127.0.0.1/speech_recog',
  engine: 'whisper',
  language: 'en-US',
  media_id: 0,  //optional
})

The text was updated successfully, but these errors were encountered:

MayamaTakeshi added a commit that referenced this issue May 30, 2024

#80: basic implementation completed

e51289f

MayamaTakeshi added a commit that referenced this issue Jun 6, 2024

#80 done

21def3c

MayamaTakeshi closed this as completed Jun 6, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add support for websocket server to start_speech_recog #80

Add support for websocket server to start_speech_recog #80

MayamaTakeshi commented Mar 7, 2024 •

edited

Loading

Add support for websocket server to start_speech_recog #80

Add support for websocket server to start_speech_recog #80

Comments

MayamaTakeshi commented Mar 7, 2024 • edited Loading

MayamaTakeshi commented Mar 7, 2024 •

edited

Loading