首页 » 软件开发 » 终于把生产力这件事做简单了(金山模型办公生产力功能)

终于把生产力这件事做简单了(金山模型办公生产力功能)

乖囧猫 2024-07-24 19:03:06 0

扫一扫用手机浏览

文章目录 [+]

作者:张倩、泽南

颠覆生产力,从这里开始。

给你一份包含成绩单的 Excel 文件,要求「成绩 <60 显示不及格,成绩在 60-80 间显示良好,成绩> 80 显示优秀」,你会怎么操作?通常来讲,这种问题需要借助公式来实现,但不常接触 Excel 的人可能不记得具体公式,于是每次遇到需要用公式的地方都会感觉手足无措,并把这种困难归咎于自己没好好学或记性不好。

终于把生产力这件事做简单了(金山模型办公生产力功能) 软件开发
(图片来自网络侵删)

但是,你有没有想过,这或许是工具的锅?

「我做了 20 年办公软件,我一直都觉得办公软件非常难用。
」很难想象,这句话出自金山办公 CEO 章庆元之口。

在他看来,包括 WPS 在内的办公软件往往集成了大量的功能和 API 接口,但普通用户上手却非常困难。
这既是用户的痛点,也是工程师们一直以来想要解决的问题。
早在 2021 年金山办公技术开放日上,金山办公副总裁姚冬曾表示,「一个成熟的办公软件应该学会自己制作 PPT」。

好在 2023 年,大模型来了,事情迎来了转机。

如果你是 WPS 的用户,你最近可能会观察到一些变化:一个叫「智能文档」的新功能已经能够帮你提供稿、广告文案、教学教案、工作周报等种种文件的自动写作。
即使它写的内容无法完全采纳,但至少能给你提供一个模板或思路,让你不必对着一片空白发呆。

这个新功能其实是金山办公 「WPS AI」办公套件的一部分,背后是业内领先的大模型技术。
随着更多功能的陆续开放,它还可以帮你一键生成幻灯片、一键分析 Excel 数据、翻译总结文档,自己写日报等等。

9 月 20 日,在 2023 金山办公技术开放日活动中,金山办公宣布,基于大语言模型的智能办公助手 WPS AI 已接入旗下全系产品,邀请用户体验全组件 AI 功能。

可以说,姚冬的「预言」已经在一定程度上被 WPS AI 实现了。
在国内,他们甚至比微软的 Microsoft 365 Copilot 还快了一步,成了第一个将大语言模型(LLM)应用在办公软件领域,并真正交付了可用产品的公司。

之前我们在看发布和 PPT,现在手上突然有了实物,大家不免好奇,自己手机和电脑上的 WPS 变成了什么样子,会有哪些黑科技?能不能尽快用上?在技术开放日上,我们获得了更多第一手的消息。

如何帮助每一个打工人?

和很多提前放出消息的大模型生产力工具一样,WPS AI 此前已经进行了公开亮相:第一次是在 4 月份,聚焦的是 AI 的生成能力;第二次在 5 月份,聚焦于智慧助理和知识洞察。
这也代表了 WPS AI 未来的三个演进方向。

首先来看第一个方向:AIGC(内容创作)。
AIGC 中的「G」代表生成,这是大家能够从 ChatGPT、WPS AI 等工具中感受到的最直观的应用方向。
在已经开放的 WPS AI 智能文档功能中,我们看到它可以生成很多非常实用的文本类型,比如招聘岗位介绍、产品需求文档、运营策划案、教学教案、电商直播台本……

它们和普通人的日常工作息息相关。
其实,大家在接触一个新工作领域时都多多少少会遇到这种「无从下手」的情况,WPS AI 就能帮你克服这个「从 0 到 1」的困境。
下图是我们在输入一些提示后得到的直播台本,可以看到,这个台本从台词到直播间背景再到展示动作都设计好了,足以帮一个刚接触直播的从业者走出第一步:

除了已经开放的「智能文档」,WPS AI 还对外展示过一键生成 PPT 等功能,只用一分钟左右就可以生成一份 15 页左右的 PPT,而且支持风格选择、局部修改,解决了演示文稿制作难度大、耗时长的办公难题。
这些功能现在也已经和智能文档一起同步开放了。

接下来是第二个方向:Copilot(智慧助理)。
在打工人的职业生涯中,每个人都要积累工作、学习资料,但如何快速消化这些资料并在需要的时候正确运用是个更大的问题。
这就是金山办公已经着手在做的事情:WPS AI 可以迅速帮你阅读资料,并把它们变成一个可以以问答形式交互的知识库。

比如,在培训时为了记住更多的内容,你可能会把 PPT 一张不落地拍下来,但要把这些内容变成个人笔记是一个非常耗时间的事情。
而时间一长,你也不记得某个知识点在哪页 PPT 上。
但现在,WPS AI 可以帮你做这些事情:它会在极短的时间内帮你消化掉拍到的内容,并回答你关于这个文档的问题。

同样的功能也适用于阅读合同等场景,AI 可以帮你看完几十页复杂的内容,对你提出的需求给出准确答案。

最后一个方向是 Insight(知识洞察),这其实非常考验技术能力。
很多时候不会干一个活的原因是这样:我们知道 Excel 可以编程,有很多好用的能力,但不知道要完成我这个任务需要用哪个能力。
WPS AI 把这个门槛打下来了,你只需要用自然语言写出命令,它就可以帮你去找软件内置的能够承担这些任务的功能按钮(或公式),然后自动把你交代的事儿干完。

这就相当于,WPS AI 给每个普通人配置了一个 7x24 小时随时在线的 Office 高手,这个高手不仅能懂你想要什么,而且对软件的所有复杂功能了如指掌,就问你动不动心?

「未来,你对办公软件提出的需求『只要想到就能做到』。
交互界面会发生翻天覆地的变化,也可能会出现全新的应用生态,」姚冬表示。

WPS AI 为什么走得那么快?

看到这么多丰富的 AI 新功能,很多人可能都想问:能尽快让大家用上吗?金山办公给出的答案是:能。
截至目前,WPS AI 已经进入了邀请测试的阶段,可以通过 ai.wps.cn 申请体验。

拥有能够快人一步落地全线生产力工具大模型能力,是因为金山办公在这轮 AI 变革中,选择了一条「扬长避短、博采众长」的路。

所谓「长」,即金山办公在过去 35 年里积累的在办公软件方面的技术经验及过硬产品。

很多人可能记得今年 4 月份被 Adobe Firefly 刷屏的经历,这款应用能够根据文字描述一键生成图像,还能智能生成独特的文字效果,让人惊呼设计行业要被颠覆了。
而它之所以能产生这么大的能量,离不开多年以来构建起来的成熟产品体系,如 Photoshop、Illustrator 等。
这些产品本身具备繁杂的功能,有成百上千的按钮,AI 的加入让这些按钮被彻底盘活,其中的想象空间必然是巨大的。

WPS 也面临类似的情况,金山办公用 35 年的时间打造了一个「巨无霸」工具,仅一个空白的 WPS 文档就有 9 个工具卡、接近 200 个按钮,其中很多功能都经过了多年的打磨,比如表现惊艳的 PDF 识别分析源于金山办公 2017 年就开始研发的 OCR 技术,PPT 智能排版是金山办公 2016 年就开始探索的方向。
可以说,金山办公已经有一个成熟的软件体系可以与 AI 大模型做深度结合,而且对用户需求有足够了解且积累了大量使用场景,这是当前很多围绕 AI 大模型做应用的公司所不具备的。

那么,如何破除二八定律,让更多的人能用上这些能力?金山办公没有选择自己从头研发大模型,而是选择做甲方,调用多家业内领先的大模型,「本着务实的态度,哪家做得好用哪个」。
对于普通用户而言,这意味着可以更快获取大模型的能力,获得的也是业内最强的能力。

WPS AI 接入大模型的历程大概经历了三个阶段。
自去年年底起,大模型技术开始在业内兴起,金山办公的工程师们构建了一些产品原形,开始进行技术验证。
很快,金山办公开始围绕大模型建立工程体系,启动了产品开发的流程,技术稳定性、产品交互体验的不断迭代。
直到今天,WPS AI 真正实现了全面上线运营。

WPS AI 选择的合作方包括百度文心一言、Minimax 和智谱 AI,都是超过千亿级参数的大模型。
需要关注的是,每一家的登记验证、数据传输、调用协议、参数调整方式都不一样,如何让各家科技公司的大模型 API 协同一致?金山办公做了一个「AI 网关」来统一管理不同的大模型能力。
在接入层解决问题,产品和业务人员就不需要关心兼容与合作问题。

在用上千亿级大模型后,把大模型转化为生产力还需要提示词调优。
金山办公在 WPS AI 背后构建了一个提示词平台,内嵌提示词调优工程能力,让大模型可以更好地适配差异化场景。

提示词平台可以帮助你在特定的任务上使用效果最好的提示词。
工程师们可以在后台为某个任务构建专用的提示词,然后尝试不同的参数选项,测试提示词输出的效果,一旦测试完成后就能进行发布,成为一个功能。
在实际使用过程中,用户向 WPS AI 提出的一些需求可能只有 20 字,但背后大模型实际上接收到的指令可能会有 200 个字。

只有这样才能保证使用不同的大模型,都能获得同样高质量的结果。
「在应用时,大模型是工程的基础设施,我们还要解决应用、产品开发和各类工程级别的问题。
从应用厂商的角度来说,工程层面的挑战比想象中要大,」姚冬表示。
「直接接入大模型的方式是行不通的。

在做好了千亿级大模型的适用和调优之后,WPS AI 还要面临第三个挑战:大模型的运行成本很高,如何让有限的算力满足大量小众场景?

对此,金山办公基于业界领先的开源模型设计了 7B、13B 小体量模型,并面向个性化细分场景进行了一系列增量训练。

本周三的技术开放日,金山办公首次对外展示了自研模型的进展。

它们的核心作用在于意图理解。
「在第三方大模型之外,我们使用小模型对于用户的意图首先进行归类:用户想要做什么,WPS AI 需要调用哪一项产品、哪一个大模型,或者只是简单的聊天 —— 然后再把需求导入到对应的产品中去,」姚冬介绍道。
「意图分类与应用场景是息息相关的。
我们必须自己标注数据,自行训练模型,才能实现足够好的效果。

此外,各项表格功能中自动写公式的模型也是金山办公自己完成的。
相比通用化大模型,金山办公自建的模型有着更好的性能。

「金山办公未来计划把 Copilot 能力拓展到更多工具上,我们希望未来的办公软件只有一条工具栏,所有复杂任务都只需要向 AI 提需求就可以完成,」金山办公 CEO 章庆元说到。
「我们甚至可能不再会向办公软件增加新功能了 —— 新的能力是基于我们向大模型提需求,它自动生成代码来执行的方式来实现的。
AI 会大幅降低办公软件的使用门槛。

变革从这里开始

WPS 是与亿万打工人朝夕相处的存在。
截至今年 6 月底,其主要产品月度活跃设备数已达 5.84 亿,用户通过公有云上传的云文档数量已超 1900 亿。
虽然经常显得低调,但 WPS 早已成为我们不可或缺的生产力工具。

另一方面,大语言模型等生成式 AI 技术的落地正在改变我们的效率,数字办公正在呈现新的趋势。

在金山办公内部,WPS AI 已经大规模使用一段时间了,大模型显著提升了人们的工作效率。
「从我自己的体验来说,现在做一个 PPT 可以节省半小时左右。
有了 AI 之后,起草文案和找模板的步骤都可以省略掉,直接进入调整和修改的阶段,」姚冬说到。
「在金山内部,最常用的功能是创作类,让 AI 帮助人们写东西,随后是辅助操作,最后是文本的阅读理解。
随着 WPS AI 用户数量的增多,或许还会有新的变化出现。

金山办公副总裁姚冬在 2023 金山办公技术开放日上。

在金山办公的眼中,WPS AI 的最大优势在于通过大模型能力把功能全面且复杂的 WPS 软件体系整合在了一起,让人们日常使用的成千上万需求仅需要自然语言就能完成表达,并快速连接到正确的功能上获得满足。

这就是 AI 对于人机交互方式的重塑。
过不了多久,以自然语言为主的沟通方式就会成为我们工作的重要一环,大模型的能力将接管所有枯燥的工作,提升我们的生产力,让我们能把精力专注于更具创造性的事务上。

这样的变革,或许随着未来 WPS AI 的全组件功能正式上线而开始。

标签:

相关文章

语言中的借用,文化交融的桥梁

自古以来,人类社会的交流与发展离不开语言的传播。在漫长的历史长河中,各民族、各地区之间的文化相互碰撞、交融,产生了许多独特的语言现...

软件开发 2025-01-01 阅读1 评论0

机顶盒协议,守护数字生活的新卫士

随着科技的飞速发展,数字家庭逐渐走进千家万户。在这个时代,机顶盒成为了连接我们与丰富多彩的数字世界的重要桥梁。而机顶盒协议,作为保...

软件开发 2025-01-01 阅读1 评论0

语言基础在现代社会的重要性及方法步骤

语言是人类沟通的桥梁,是社会发展的基础。语言基础作为语言学习的基石,对于个人、社会乃至国家的发展具有重要意义。本文将从语言基础在现...

软件开发 2025-01-01 阅读2 评论0

粤语电影,传承文化,点亮时代之光

粤语电影,作为中国电影产业的一朵奇葩,以其独特的地域特色、丰富的文化内涵和鲜明的艺术风格,赢得了广大观众的喜爱。本文将从粤语电影的...

软件开发 2025-01-01 阅读3 评论0

苹果游戏语言,塑造未来娱乐体验的基石

随着科技的飞速发展,游戏产业逐渐成为全球娱乐市场的重要支柱。在我国,游戏产业更是蓬勃发展,吸引了无数玩家和投资者的目光。而在这其中...

软件开发 2025-01-01 阅读1 评论0