不得不说,讯飞语音输入着实强大。不仅输入后的识别率相当出色,而且在说完一段话后,它还能帮忙反复润色两三次,剔除重复啰嗦的部分,这点实在难能可贵,比
搜狗等同类产品强出不少。
不过,它在某些特定场景下存在一些小问题。比如在
苹果手机的
微软 IE 浏览器中,若同时打开 DeepSeek 网页版并使用语音输入,约有 50% 的概率,首次点击语音输入只能录入一个汉字。这时需删掉这个字,再次点击语音输入才能恢复正常。我也是偶然才发现这个规律,之前遇到首次只输入一个字的情况,就直接放弃了,转而去微信、豆包,或者类似记事本的便签里进行语音输入,之后再把内容拷贝回来当作问题。虽说现在再点一次语音输入就能解决,稍显不便,但确实节省了大量时间。
说到时间,我还是稍有不满。就像今天下午探索 OCR 识别时,它没能及时告知我当下好用的主流第三方 OCR 库。问了许久,才得知 RapidOCR 这个国产开发的库,效果极佳,安装还简便,对 Python 库没什么苛刻要求。估计稍有开发经验的人员都清楚这些,可我并不了解。一开始我安装 Python 库,就挑最新的 3.13 版本,结果它推荐的前两款库要求 Python 版本在 3.7 - 3.10 之间,这就很尴尬了。要么不用,要用就得卸载现有版本,重装 3.10 的 Python 库,这也算走了弯路、交了学费。要是 AI 或者大语言模型能提示我,做开发别用最新的库,因为很多第三方库可能还没适配,用稍旧但功能足够的库就好,我肯定会更谨慎些。但没人提示,我自己也没这意识。不过做 Java 开发我就会有这个意识,毕竟 Java 版本更新频繁,基本一年甚至一年推出两个版本,现在多数人做 Java 开发还用的是 Java JDK8 版本,少量用 9 版本,这确实和经验相关。
如今 AI 的智能程度日益增强,要是还守着老思想,不学、不关注,只顾过自己的小日子,肯定不行。这也是我一直想把交易做成半自动化的重要原因,我不想完全跟不上时代。即便每年少赚点甚至不赚钱,也得尽量用上 AI 这个工具,了解它未来的大致发展方向,比如医学领域很可能会有重大突破,更确切地说是生物领域的突破间接带动医学发展。现在强大的 AI 用于识别核磁共振片子等,效果已达顶级专家水平。如此一来,拍片子医生的工作量将大幅减少,或许以后一个医生就能兼顾多台机器,只需操作机器,让 AI 辅助判断片子有无问题,原本专家 15 分钟看一张片子,现在一两分钟甚至更快就能完成,极大改变了医生的工作方式。
AI 对我们日常生活的影响同样巨大。前几天元旦晚上,老婆带孩子去深圳湾骑车,说公园人很多,还看到美团用大疆
无人机送外卖到指定地点。自动化系统与外卖订单、无人机配送相结合,形成一条龙服务,未来外卖行业竞争势必更激烈,赚钱也会愈发困难。这让我想起前两天看到的视频,广州不少外卖员为节省开支,不租房,在桥洞或桥底搭帐篷睡觉,毕竟广东一年 12 个月有 11 个月如夏天,睡帐篷不会太冷。还有
滴滴网约车司机,为多开车赚钱,晚上直接睡在车上。尽管他们开车时间比 5 年、7 年前长得多,收入却少了很多。这种趋势一旦形成,很难逆转。科技发展给消费者带来便利的同时,对某些商业模式或行业可能造成毁灭性打击。就像
拼多多、淘宝、
京东等电商平台的兴起,让线下门店生存空间大幅压缩。不少小老板买了商铺或租店铺做生意,却赚不到钱,甚至有人投入过大,只能无奈收场。面对这种情况,他们又能找谁问责呢?