9.png

light

摸索了一下音声机翻,汇报一下成果,工具是whisper和chatgpt

简单来说就是whisper识别日文,然后用chatgpt进行翻译

论坛里面已经有老哥尝试过,但是方法比较麻烦
https://south-plus.org/read.php?tid-1750456-keyword-whisper.html


这里提供一个非常简单的方法

附了一段人工翻译和机器翻译的结果在下面,大家可以比对一下效果。

首先你的有一个chatgpt的api

如果你有api的话,那么步骤如下:

第一步,通过buzz将音声转换成文字

你可以将buzz看成是whisper的图形界面

whisper是openai开源的语音转文字工具

项目地址:https://github.com/chidiwilliams/buzz

软件下载地址:https://github.com/chidiwilliams/buzz/releases

这个软件的使用方法可以看 https://www.appinn.com/buzz-openai-whisper/

使用起来非常傻瓜

第二步

将第一步中得到的srt文件上传到 https://ai.cgsv.top/zh-CN

然后输入chatgpt的api进行翻译

同样非常傻瓜

尝试下来,感觉这个机翻方法有以下两个问题:

1. 机翻的老毛病

有许多纰漏错译,但大概可以帮助你理解剧情。

2. 速度慢

如果你没有n卡,可能识别一分钟的音频需要两分钟时间。

不同模型识别速度不一样。








好像无法上传附件,我就截取两分钟进行比较吧

人工翻译:

[03:52.31]哈?那种东西什么时候…该不会说 那瓶茶?
[04:00.59]难以置信!太差劲了!让我喝那种东西…
[04:05.51]该不会最开始就有那种打算!
[04:08.02]不要 手臂好痛
[04:12.53]放开我 不要
[04:15.47]不要 不要用腿磨蹭小穴啊 感觉很奇怪啊
[04:22.64]不要 不要 在这种地方 如果有谁来了的话…
[04:30.40]和在上课中没关系吧 不要不要
[04:36.92]那个 不要那么揉啊 不要
[04:45.76]很柔软什么的 那种感想不要说啊
[04:50.09]都说了不要了
[04:57.71]那里不要 不要对乳头搓来搓去啊
[05:07.43]不要这样揪啊…
[05:15.22]停下来 求你了
[05:19.27]等等 为什么把纽扣解开了
[05:21.79]都说了不要啊 手臂…
[05:26.15]不要 不要看啊
[05:29.94]这样盯着我 不要啊
[05:32.65]要是碰了的话绝对饶不了你
[05:35.94]等等 才刚说就!好讨厌
[05:43.73]不行 怎么能这样
[05:47.03]欸?胸罩 怎么可能可以解开来啊!
[05:51.63]听我说话啊 啊 不要 不要啊
[05:57.70]别看我…真是的 讨厌啊
[06:05.30]才不是 怎么会有感觉…
[06:08.39]这是因为被你喂了媚药才这样的
[06:18.00]真是的 都说了不要 不要啊
[06:27.25]被像你这样的人…乳头不要啊
[06:41.34]等一下 已经不行了
[06:45.84]腿 不行 不要碰啊 感觉有什么要来了
[06:53.93]不要摸啊…
[06:58.70]不行 不可以把裙子卷起来…
[07:05.15]内裤 都湿透了 很害羞的啊
[07:10.49]不要 不要看啊 不要不要
[07:18.50]手指 不行 不要摩擦啊
[07:39.97]对不起 要忍不下去了
机翻:

00:03:35,000 --> 00:03:59,000
什么?你在听吗?你从刚才开始身体就很奇怪啊。所以别碰我。什么?现在是什么时间?美容区?那是什么时候?难道是那个茶?

19
00:03:59,000 --> 00:04:11,000
我真的不敢相信你会这样。你怎么可以让我喝那个东西。难道你一开始就是这个意思吗?好痛。

20
00:04:11,000 --> 00:04:33,000
啊,你在干什么?我不喜欢。不要用你的脚碰我。这很奇怪。我不喜欢。在这种地方。如果有人来了,跟上课没关系。

21
00:04:33,000 --> 00:04:54,000
啊,不要,不要。不要这样摸我的腿。不需要说柔软之类的感想。我不喜欢。

22
00:04:54,000 --> 00:05:02,000
啊,那里不行。千寻,不要这样做。

23
00:05:07,000 --> 00:05:17,000
不要碰我。拜托了。

24
00:05:17,000 --> 00:05:38,000
啊,等一下,你在按哪个按钮?不要啊。我的手臂。不要看。你看得太多了。不要碰我。因为会很痛。

25
00:05:38,000 --> 00:05:56,000
啊,不要。这样不行。啊,你要拆掉皮肤吗?听我说话啊。啊,不要。

26
00:05:56,000 --> 00:06:20,000
不要看。我不是那个意思。这是后续要吃微量药物的。我真的不想。

27
00:06:20,000 --> 00:06:36,000
不要了。啊,你在我里面。千寻,我真的不想。

28
00:06:36,000 --> 00:06:50,000
等一下。不行了,不要碰我的脚。因为我会尿裤子。很尴尬。啊,不要这样看。

29
00:06:50,000 --> 00:07:12,000
不要摸我。不要掀起我的裙子。我的内裤湿了。很尴尬。啊,不要这样看。

30
00:07:12,000 --> 00:07:21,000
啊,不要。啊,不要。啊,你用手指摩擦我的腿,我不喜欢。

31
00:07:21,000 --> 00:07:24,000
崩溃了

1037406.jpg

大菠萝

B1F  2023-04-06 17:57
(木有鱼丸)
想想就知道不行的,回答用词都太“正经”了。

642d445856914.gif

MBP

B2F  2023-04-06 18:00
(嘿,说你呢,给你一拳)
好有礼貌的色色
话又说回来音声我更多的是听个乐,当BGM用为主,这样用机翻能够的大致理解一下意思好像到也挺不错的?

1425871.png

orangesoup

B3F  2023-04-06 18:04
(唔。。。NTR真的是太棒了。)
音声机翻可太折磨了,没有图,翻错了都不知道

none.gif

中津静流

可以了  能听个大概意思也是好的

a1.gif

EVe4

是哪部呀RJ号呢   

814836.png

地瓜叶

B6F  2023-04-06 18:36
(为没有牛头人的纯爱世界献上祝福)
没显卡可以传到谷歌盘,用colab跑。二十多分的音频选择最高质量模型,转换时间差不多十来分

1vdw7z.png

榴半仙

B7F  2023-04-06 19:09
(举头磕药片,低头吞胶囊/希望找一只可爱男娘)
看来用词还需要调整,成熟的翻译api都有个术语库,用户可以自定义哪些词翻译成什么样

iria


6e8038e76bb0708d42fd8.jpg

KevenMill

B9F  2023-04-06 20:39
(投席!)
技术贴,支持

none.gif

zyh

chatgpt一直说请求太多,看来得搞个付费账号

none.gif

纯良萌萌人

B11F  2023-04-06 21:11
(dlsite翻译社团「純愛の戦士たち」,作品多为s向纯爱音声)
我跟你讲,近两年内是不可能的。
稍微一进h就错误百出,名词错20%,逻辑错一半,基本你能看到的都是ChatGPT帮你yy出来的。
例如:
お酢 オス
かり かりくび
陳歩 ちんぽ
写生、謝罪  射精

但是h前的对话正确率尚可,而且whisper好在可以帮自己准确的听出假名,自己再进行联想,不用慢慢一个音一个音的听。

1496506.jpg

ツカサ

回 6楼(地瓜叶) 的帖子

我用的那个n46whisper,为啥上传20M音频文件就要化5分钟

1496506.jpg

ツカサ

回 6楼(地瓜叶) 的帖子

直接select盘里的很快好了好了

1522107.png

GTX信仰

关于这种涉及到api密钥的东西,如果你是花钱开了plus版,非官方网站的话还是要慎重考虑一下。
当然,也感谢楼主的教程分享。