第13期-在线的文章摘要生成器, 自己写了一个支持中文的

大家可能还记得我写的第12期-在线的文章摘要生成器,使用NLP生成简介

在那篇文章里我们介绍了一款通过NLP分析文章,自动生成摘要的一个小工具。

当时我就说这个玩意,还是很实用的,于是就上手自己撸了一个支持中文生成文章摘要的生成器。访问地址http://zhaiyao.xiezuoguan.cn/

《第13期-在线的文章摘要生成器, 自己写了一个支持中文的》

效果还可以,我找一篇腾讯网的新闻报道来给大家试验一下,报道为《无聊催生的一次狂欢:云蹦迪、云睡觉,虚火一场?》

经过我们的自动生成器,将内容概括如下

博主“谁家的圆三”也意外掀起了一场互联网的狂欢,带起睡觉直播的风潮,人气最旺的一晚,一共有1850万用户围观他睡觉。

1月9日开始,每天5小时,连续三天“云蹦迪”直播后,北京知名夜店ONE THIRD在抖音赚到了332.36万打赏,单日超过100万元,直播首日收看人数就已破百万。博主“谁家的圆三”也意外掀起了一场互联网的狂欢,带起睡觉直播的风潮,人气最旺的一晚,一共有1850万用户围观他睡觉。

《第13期-在线的文章摘要生成器, 自己写了一个支持中文的》

从我个人的使用效果来看,效果并非完全令人满意,最好还是有人为介入来二次加工一下。二是现在文字阅读内容质量堪忧,自从自媒体开始兴起,每天网上产生的都是大量的文字垃圾,大部分人更是失去了对于1000字长文以上的阅读能力。篇篇都是几百字的小文章根本没什么好办法生成120字内的摘要概括啊。

另一方面流量也越来越便宜,人们的文字阅读兴趣更是被图片和短视频瓜分掉了。我自己试用这个工具时,去腾讯网上翻了很多篇新闻,结果三分之一是以图片为主,图片中有零散文字(确实排版会更精美,信息量也足够),另外三分之一都是不超过1000字的短篇。剩下的三分之一里面,还被视频给占据了一部分,只有极少数的文章能写到1000字以上用这个工具来好好概括了。

技术方案

难度系数 ⭐
我这边是用python写的,后端就是上一篇写的fastapi框架确实比flask还要省事,实现方式参考了网上的一些方案。部署时本来打算探索一下新东西用一下腾讯云的云函数和api网关,结果折腾了半天好麻烦啊,最终还是部署在了服务器里。
前端我不擅长,做的特别丑,能用就行吧。

我们可以怎么做:

上次提到的,Chrome插件这个需求还可以做。

另外我还发现,如果以后大家倾向于视频内容,不如做一个能够支持视频自动摘要的工具。但是这个就很难了,随口一说,短期内应该还是人力才能解决的工作。

点赞