先带大家看一下深度学习模型发展历程:
2014年:GAN 图像生成发布,对输出结果的控制力较弱,容易产生随机图像、分辨率比较低。
2017年:Transformer 自然语言模型发布,引入自注意力机制,能够基于两个单词间的关系进行建模,有效理解单词在上下文中的意思,支持并行训练,使语言模型训练效果达到新高度。是自然语言理解飞跃性发展,平行训练优势逐步发展出超亿规模的大模型,ChatGPT打开AI新纪元。
2021年:CLIP 文本-图像生成发布,对文字、图像分别进行训练,不断调整两个模型内部参数,使得模型分别输出文字特征值和图像特征值并确认匹配,多模态技术推动AIGC内容多样性雏形。
2022年:Diffusion 图像生成发布,通过增加噪声破坏训练数据来学习,然后找出如何逆转这种噪声过程以恢复原始图像,高效地解决GAN无AI绘画法训练、训练不稳定的问题。图像生成技术突破,点燃AIGC
从以上的发展不难看出,AIGC今年的爆发是厚积薄发的必然结果。
近日,苹果官网宣布将于今年晚些时候推出全新的辅助功能,包括眼动追踪,可以帮助残障用户通过眼动来使用 iPad 或 iPhone。
1. 眼动追踪:苹果将推出眼动追踪功能,帮助残障用户通过眼动来使用iPad或iPhone。该功能通过设备端机器学习设置和校准前置摄像头,不与Apple共享数据,且不需要额外硬件或配件。 2. 音乐触觉:为听觉受损用户提供一种新方式来体验iPhone中的音乐。触感引擎会随着音乐播放产生振动,适用于Apple Music中的数百万首歌曲。 3. 人声快捷键:允许用户通过自定义声音来执行任务,同时还有倾听非典型语音功能,增强语音识别范围,专为语言功能受影响的用户设计。 4. 车辆运动提示:减少晕车的新功能,通过屏幕边缘显示动画点代表车辆运动变化,帮助减少感官冲突。 5. CarPlay 语音控制和辅助功能更新:包括语音控制、色彩过滤和声音识别,以提高对听力和视觉受损用户的可访问性。 6. visionOS 辅助功能:包括全系统的实时字幕、FaceTime实时字幕、Apple Vision Pro的字幕功能,以及其他视觉辅助功能,如减少透明度、智能反转和减弱闪烁灯光。 7. 其他更新:包括旁白、放大器、盲文屏幕输入、悬停输入、个人声音、实时语音、虚拟触控板、切换控制和语音控制的改进。
这些功能预计将在iOS 18、iPadOS 18和macOS 15等更新中提供,但苹果没有明确表示具体时间。
其中小编最感兴趣的是 iPhone 这个防晕车的功能升级,还是很贴心的!
主要是依赖iPhone的传感器和机器学习算法,除了iPhone,到时在iPad上也能体验这项新功能。
晕车其实是因为眼睛和内耳的感官较劲,引发的冲突。这种冲突让有些人在车上玩手机或平板时会难受甚至想吐。所以到时“车辆运动提示”会在屏幕边缘,跳出一些小点,模拟车辆的运动变化,帮助眼睛和内耳讲和,不干扰你正看的内容。传感器会聪明地识别你是否在移动的车上,并作出相应的调整,确保你在车上也能愉快地刷屏。