有多少小伙伴是和我一样,早在2年前就已经不用微软的office套装了,之前是觉得office打开那种体积很大的文件,反应速度太慢了,才用的wps,现在WPS AI正式对外展示了文字、表格、PPT、PDF四大办公组件搭载的AI大模型能力,支持pc及移动设备。本次公布的AI新能力集中在阅读理解、问答、人机交互等方面。在PPT中,WPS AI现已支持输入主题,一键生成PPT演示文稿,并会根据用户要求进细化调节,如更改主题风格、单页美化、更改字体、更改配色、生成演讲稿等等。如果WPS的AI功能能够更好的帮助我们办公,你还会等微软的office吗?
现在,你可以像和 ChatGPT 聊天一样使用谷歌地图了。
谷歌地图最新升级包括以下 5 点: 1. 对话式地图搜索 直接与 Google Maps 聊天搜索信息,AI 将使用 Google Maps 上的商户信息、照片、评分和评论等信息来提供可信的结果。
2. 实时查看地图 只需点击相机图标即可使用实时视图进行搜索。谷歌地图会显示附近的 ATM、餐厅、公园和公交站,并显示其开放时间和评级,且跟随 AR 箭头,准确引导您到达目的地。
3. 全新沉浸式视图 在正式访问地点之前先确定其范围,查看逼真的视图,并获取天气预报、高峰时段等有用信息,而且还能查看室内景观。比如在订餐时可以展现餐厅氛围,帮助您选择。
4. 新增多重搜索 现在,您可以结合文字和图像, 在 Google 地图上访问数百万本地企业的信息。
5. 获取人工智能建议 随时随地获取人工智能支持的建议。如果开始下雨,可以向地图询问“雨天活动”并获取附近的喜剧表演或电影院等建议。
4月10日凌晨,谷歌在官网正式发布了Gemini1.5Pro,现在可在180多个国家/地区使用。
Gemini 1.5 Pro 不仅能够生成创意文本和代码,还能理解、总结上传的视频和音频内容,并且支持高达100万tokens的上下文。
在Google AI Studio开发平台中,用户可以免费试用Gemini 1.5 Pro,并且它支持中文提示。这使得用户能够通过简单的操作,上传视频或音频文件,并获取内容的深度总结。例如,用户可以上传一个视频并询问影片的内容,Gemini 1.5 Pro能够快速解析并提供答案。
Gemini 1.5 Pro还提供了音频理解功能,能够快速解析音频文件并总结其内容。这对于需要处理大量视频和音频内容的用户来说,无疑是一个巨大的帮助,因为它可以节省大量的时间。
谷歌还对Gemini API进行了性能优化,包括系统指令、JSON模式以及函数调用优化,这些改进显著提升了模型的稳定性和输出能力。系统指令功能允许用户根据特定需求控制模型的行为,JSON模式可以帮助开发者从文本或图像中提取结构化数据,而函数调用优化则支持开发者实现更全面的查询响应。
详情点此查看: https://developers.googleblog.com/2024/04/gemini-15-pro-in-public-preview-with-new-features.html
音频理解能力: https://github.com/google-gemini/cookbook/blob/main/quickstarts/Audio.ipynb
jitter.video去年让不少设计师眼前一亮!这是一款为咱们设计师和创意达人们量身定做的动画设计神器,目标就是让你做动画的时候省时又省力。来看看几个理由,为啥会是你工作中的新宠儿?
① 操作简单上手快:Jitter的设计界面友好,哪怕你是新手小白,也能迅速找到感觉。用它来搞品牌动画、社交媒体的小视频、网站或者APP上的小动效,都能得心应手。
② 功能强大样样精通:不管是动画UI、短视频、社交帖子,还是网站和应用的设计,Jitter全都能搞定。一个平台解决多个需求,直接把效率拉满!
③ 高效的工作流:和Figma的完美结合,让你在创作的时候更加专注,不用再为了那些复杂的编辑和动画设置烦恼。这样一来,团队合作也变得更加丝滑。
④ 专业级输出:不管是用来做吸睛的营销视频,还是打磨品牌的精美动画,Jitter都能满足高品质作品的追求。毕竟有丰富的工具和模板库支持!
今天凌晨,微软带来了一系列重磅产品,一口气发布了 50 多项更新。
发布会上,微软 CEO Satya Nadella 谈到了关于现代计算的两个梦想。一个是计算机是否可以理解我们,而不是我们必须理解计算机?第二个是在这个信息不断增加的世界里,计算机能否帮助我们根据所有这些信息进行推理、规划和更有效地采取行动? 从 AI 基础设施的搭建,到模型产品的落地,微软在寻找答案的过程中,逐渐成长为一个全方位的 AI 解决方案提供商。今夜过后,或许我们都得重新审视微软这个巨头。
发布会要点速览: 1、Team Copilot ,从个人助理变成团队助理 2、全新的 Agent 代理功能 3、Phi-3 家族迎来新成员 4、Azure AI Studio,包含 API 集成、完整的工具链及部署全家桶 5、Fabric 大升级,推出实时智能(real-time intelligence) 6、专为云端规模化应用性能优化的 Cobalt 芯片
发布会更多详情:https://mp.weixin.qq.com/s/MoHPci4JAb25ifDhMwUWiQ
随着今年WWDC的临近,记者 Gurman 在其最新一期《Power On》专栏中,为我们揭秘了苹果在人工智能领域的最新进展。苹果将对其智能助手Siri进行升级,新版本的Siri将依托于苹果自主研发的LLM技术,为用户提供更为智能的服务。
除此之外,苹果还将在多个方面引入AI技术以增强用户体验,例如通过AI技术实现语音备忘录的自动转录、照片的智能修饰,以及Spotlight和Safari搜索功能的优化。而且,AI还将能够根据用户的短信内容,动态生成个性化的表情符号。
在个性化界面方面,苹果也做出了创新。用户将能够摆脱网格的限制,自由地在屏幕上摆放图标,并可以自定义图标的颜色,这一改进虽与AI无直接关系,但无疑将极大地提升用户体验。
同时,有消息称苹果将在即将到来的 iOS 18 和 macOS 15 系统中,为 Safari 浏览器加入一系列人工智能支持的新功能。
1、智能搜索。 苹果可能在搜索中引入 Ajax 语言模型来提供文本摘要。
2、Web橡皮擦:这一功能强调用户界面的简化和隐私保护的增强,允许用户自定义网页内容,删除不需要的元素,如广告和图片。
3、用户界面更新:苹果正在将 Safari 的关键工具集中到一个位置,以提高用户的访问效率。
4、 AI增强的视觉查找:苹果可能在2025年推出高级视觉搜索功能,允许用户通过图像获取信息,类似于 Siri 目前识别照片中的植物、宠物和地标的功能。
这些新功能的加入,将使Safari浏览器的使用体验更上一层楼,你觉得哪项最实用呢?