Re: [分享] openai_whisper / faster-whisper /webui

看板 AI_Art
作者 Laviathan
時間 2024-07-01 23:14:54
留言 0 ( 0推 0噓 0→ )
回文 3則
借標題請教一下 今天faster-whisper發布新版本支援Silero VAD 可是我看他的範例是用mp3檔,不是用串流 這樣如果我要做即時逐字稿跟翻譯的話 是不是只能用while反覆偵測有沒有人在講話? ※ 引述《blarc (blarc)》之銘言: : 先感謝大大分享跟介紹! : 最近使用fast-whisper-large-v2來翻譯日綜 : 有一些心得跟問題想請教 : 目前翻譯的效果還可以, 至少可以看懂7成內容了, 但感覺還有改善空間 : 遇到一些人名/地名/專有名詞會比較苦手 : 這部份我是利用Initial Prompt來改善 : 先把藝人名或節目介紹的地名先打上去, 翻譯會比較傾向用你提示的內容 : 不過好像有224個token限制的樣子 : 另外有時候會遇到一段翻譯一直重複同一個句子長達幾分鐘 : 感覺像是卡住或是落入loop : 我有試著把VAD - Max Merge Size 從90改成180或更高 : 或是去Full頁面把Condition on previous text取消掉 : 可以減少這種重複句子的問題 : 最後有兩個想請教的地方 : web-ui上有translate model和language欄位 : 這兩個欄位的用途是? for translate task用的嗎? : 還是跟翻譯成中文有關? : 另外我透過修改config的方式下載其他model來做transcrbie : ex: zh-plus/faster-whisper-large-v2-japanese-5k-steps : arc-r/faster-whisper-large-v2-mix-jp : 不過效果怎麼比原本faster-whisper-large-v2還差 @@ : 我以為這些model是為了加強日語辨識, 還是我還少做了什麼步驟嗎? : 謝謝. -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.248.218.244 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/AI_Art/M.1719846897.A.DD8.html

最新文章

Re: [蔚藍] hews 狗面捏 U卡
c_chat tsubasa0922
2024-09-19 23:54:49
[九日] 誰想和羿結婚?
c_chat eo8h1
2024-09-19 23:54:43
[24夏] 我要招架一切 12 END
c_chat katsuyuki118
2024-09-19 23:49:43
[問題] 一首自創語言的遊戲BGM
c_chat flippingcat
2024-09-19 23:49:34
[蔚藍] 小籠包
1 1 c_chat nahsnib
2024-09-19 23:41:45
[耍廢] 30NT微軟飛行模擬器
c_boo kopune
2024-09-19 23:40:03
[閒聊] 遊戲業界的至聖先師是誰
2 3 c_chat ndhuctc
2024-09-19 23:38:48
[24夏] 深夜Punch 11 等大結局吧
3 4 c_chat yeldnats
2024-09-19 23:33:22
[閒聊] 怎麼還想著復活啊(有雷
4 7 c_chat feedcat
2024-09-19 23:33:03
Re: [柯南] 小蘭不會覺得新一怪怪的嗎?
1 3 c_chat smart0eddie
2024-09-19 23:24:09
[閒聊] 輕羽飛揚參考的羽球選手
2 5 c_chat einstean
2024-09-19 23:23:25