889485.png

我叫拉法姆

GF  2019-12-30 20:18
(拉法姆才是____)

【人脸识别番号、女优】初版开放测试

很遗憾, 在清理无用服务器时不小心删除了存有人脸数据的主服务器, 数据全部丢失, 待他日重启
2020/1/6开放测试,交互方式为tg机器人@JavRecognizeBot 数据还不全,多女优出演的作品暂未录入
2019/12/31 女优人脸录入完毕,集群正在录入作品数据。
2020/1/3 单个女优出演的作品信息已经录入完毕,正在校验
2020/1/3 单个女优的作品确认正常, 看图
急需前端!我是真的不会做前端..

之前我做过一个人脸识别女优,但是因为数据集只有女优的一张大头照,识别率不高

现在,我采集了 javbus 6w名女优及 400w张封面、视频预览图,准备对搜索引擎进行训练。建立每张人脸与 作品,女优的对应关系。训练后不仅能知道是谁,还有概率能得知来自哪部作品

一开始我是打算使用 Azure 的认知服务,后来发现要想录入 400w 张人脸要 4000 美金..

所以就自己开发了一套 jav 搜索引擎,python 语言,使用 face_recognition 进行人脸识别,使用 milvus 进行向量搜索,400w 量级的搜索可以在毫秒内完成,召回率100%

目前的问题是,需要开发一个前端来提供服务,而我不会前端

如果有懂前端开发的朋友,对项目感兴趣,欢迎联系我


请看DEMO(该demo来自人脸识别项目的最初制作者@resokou大佬,本项目只是对resokou大佬所做的二次开发和增强


none.gif

817e4586

B1F  2019-12-31 18:20
我做过10000个明星的人脸识别py代码,素材用了300W张头像,自己家里电脑提取训练一两周就解决了,主要还是获取准确的训练集有难度,封面的头像不准确,又很难保证视频截图提出来的脑袋里就是你需要的那个脑袋。训练模型和部署都不算什么。
根据我从另一个日本本土av女优数据库网站爬下来的数据,所有数据库里的日本av女优里也就25000人有头像,应该不需要60000人那么多。

none.gif

817e4586

B2F  2020-01-01 16:00

回 118楼(我叫拉法姆) 的帖子

百分之97-98吧,有些是真的看上去像另外一个人就会被识别错。我已经投入到生产系统里了。

none.gif

817e4586

B3F  2020-01-01 16:40

回 122楼(我叫拉法姆) 的帖子

模型要自己训练的。。。在训练集准备好的情况下25000个不同的人 500W头像的话  1080ti训练好至少也要半个月吧

none.gif

817e4586

B4F  2020-01-01 16:44

回 122楼(我叫拉法姆) 的帖子

以前想顺手做了这个识别艾薇女优的项目,感觉代价和效果不好的风险太大了,放弃了,碰见不认识的女优还不如直接问人。