Browse By

No Thumbnail

印度政府将发表全球最大公开资料库

要训练人工智慧模型,庞大资料库不可或缺,拥有全球第二多人口的印度最近宣布,将公开大型资料库,以催化下一代金融和网路科技。

印度科技部长 Rajeev Chandrasekhar 最近公布印度人工智慧发展计画 IndiaAI,将发表「全球最大公开资料库」,也是 IndiaAI 重要环节。Rajeev Chandrasekhar 未详细说明资料库内容,以及如何改变网路世界,不过印度拥有非常丰富的金融数据,包括政府管理的统一支付系统等,对开发金融科技模型很实用。

Rajeev Chandrasekhar 表示,即将面世的《数位印度法案》加入人工智慧管理法规,取代有 22 年历史的 IT 法案,因太旧很多新技术如网路等都未提及。新法案涵盖电信监管至网路行为等。他形容目标是维持开放,同时让占主导地位的科技平台不会造成危害,妨碍使用者的消费活动。

  • India teases AI plan to ‘catalyse the next generation of the internet’

(本文由 Unwire Pro 授权转载;首图来源:Pixabay)…

No Thumbnail

经典指针与智慧科技融合!Garmin 全新 vívomove Trend 打造「全时工艺」,携手寒居酒店打造美型生活体验房!

经典指针与智慧科技融合!Garmin 全新 vívomove Trend 打造「全时工艺」,携手寒居酒店打造美型生活体验房!

智慧穿戴品牌 Garmin 最新用户数据调查指出,2020 年至 2022 年间,主打健康监测表款中,台湾整体女性用户大幅成长了55%,全亚洲亦高达 67% 的成长,可见女性对智慧表款需求持续增加。为提供消费者更时尚精致的表款选择,Garmin vívomove 敲敲系列推出全新「vívomove Trend 指针智慧腕表」,经典指针设计结合全屏隐藏式触控萤幕,轻敲表面即可唤醒全面升级的智慧科技,以全时工艺打造美型生活。内建进阶版全天候健康监测,并有多种室内外运动模式及专属女性健康功能,首次支援无线充电,同时内建Garmin Pay 行动支付与智慧通知,举手投足之间展现优雅智慧生活。

你可能对这个有兴趣…

全系列推出 4 款百搭新色,神秘感十足的深邃黑、静谧冷艳的宁静灰、时尚活泼的摩卡金以及质感奢华的玫瑰金,每款皆搭配专属设计指针,享受健康智慧生活时亦能尽展个人品味,建议售价 $9,900 元,3 月 2 日正式在台开卖。

Garmin 亚洲区行销与业务副总经理-林孟垣 Scoppen表示:「vívomove 系列为业界唯一结合经典指针与智慧表技术的产品,不再需要取舍於智慧功能与时尚美型,自推出以来就深受市场欢迎,台湾 2022 年 vívomove 系列用户就有 66% 成长,本次新品特别选在 3 月国际妇女节期间推出,应援现代女性多元角色及体贴照顾健康,同时携手寒居酒店推出 …

No Thumbnail

Google 公布核弹级 AI API:通用语音模型(USM)

去年 11 月公布计划之後,Google 最近发表了他们自己的通用语音模型(USM)API 与研究成果,参数拥有 1200 万小时语音和 280 亿组训练、涵盖 300 多种语言,目前已经可以支援 100 多种语言自动辨识。从支援语种、资料库大小来看无疑是核弹级的模型(而且还在持续发展中,最终目标是支援 1000 种语言)。这里是 USM 的几个重点:

自我监督学习三部曲

目前自动语音识别(ASR)的最大挑战是传统监督学习方法缺乏可扩展性、费时费力,模型本身需要更高效的方式改进来扩大语种跟辨别品质。

Google 采取的方式「不断自我监督学习并微调」。详细做法是,第一步使用自我监督学习法 BEST-RQ,可以在无外部监督的情形下大量分析并学习语音资料(光这一步就是 80% 工作量);读者可以想像,这阶段完全是由机器自己监督、自己学习,完全不依赖人工。

Photo Credit: Google

第二步则是使用多目标监督预训练模型来整合来自其他资料的知识,主要是由 text injection、BEST-RQ 跟监督式 loss 函数共同训练。第三则是只让监督式 loss 函数介入,对终端任务进行微调。Google 表示第一、二阶段产出就非常好,乃至於第三阶只占了 5% 工作量,那能获得品质就非常好的整体模型

对,所以你看 YouTube

No Thumbnail

你应该要随时保持连线VPN的状态吗?

好吧,或许有时候这样的提醒过於「鸡婆」,但如果可以一直连着 VPN 使用网路绝对是最好的,严格来说,一直保持着 VPN 的连线,优点一定是大於缺点的。

这篇除了会告诉你为什麽应该要一直保持着 VPN 的连线之外,也会以几个常见的例子举例,为何你应该要这样做。

VPN 是否要一直保持连线状态?

是,如果可以的话,请一直让你的 VPN 保持着连线状态,VPN 的连线可以确保你的信息是受到保护的,不会被泄露任何的资讯,以及广告还要骇客的入侵,换言之,就可以保护你在网路上行为的安全。

[tcb-script async=”” src=”https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js”][/tcb-script] [tcb-script] (adsbygoogle = window.adsbygoogle || []).push({}); [/tcb-script]

你应该要保持 VPN 连线的七个理由

1. 当你连接公共 Wifi

「欸我们去外面用免费的 Wifi 啦」这种话你一定听过,但你知道吗?

其实在外面使用免费或是公共的 Wifi,都连接上这个 Wifi 的使用者是可以轻松的访查到你的数据跟个人讯息的,更别提你的信用卡跟钱相关的资讯,所以在外使用免费或是公共的 VPN 的话,请用 VPN …

苹果专利为AR/VR交互提出虚拟人数字助手解决方案

(映维网Nweon 2023年02月22日)数字助手可以在人类用户和电子设备之间提供有益的界面,允许用户使用口语和/或文本形式的自然语言与设备或系统交互。但用户可能会提供不明确的请求或不明确地指代对象,特别是在计算机生成现实领域。因此,数字助手可能很难确定对请求的适当响应,除非解决了不明确的指代。

所以在名为「Digital assistant reference resolution」的专利申请中,苹果就提出了一种关於数字助手的指代解析。

图2描绘了用於完成对象确定过程的示例性数字助手200。如图所示,数字助手200包括指代检测器202、指代分类器204、文本指代解析模块206、基本视觉指代解析模块208、复杂视觉指代解析模型210和实体资料库212。指代分类器204、文本指代解析模块206、基本视觉指代解析模块208、复杂视觉指代解析模型210和实体资料库212被包括在单个指代解析模块214中。

图3和图4描绘了用於对象确定过程的示例图像输入。图3包括语音输入301、负鼠302和树303。图4包括语音输入401、绘画402和沙发403。图3和图4中的每一个都将与图2的各种组件以及可以由数字助手200接收的输入的各种示例一起讨论。

在一个实施例中,数字助手200接收口语输入201,并通过对口语输入201执行自动语音识别和/或自然语言处理来基於口语输入201确定多个用户意图。因此,数字助手200可以选择多个用户意图中的用户意图,并基於所选择的用户意图确定要执行的一个或多个任务。

在一个实施例中,数字助手200接收语音输入201并将语音输入201提供给指代检测器202。如图3所示,数字助手200可以接收语音输入301「那是什麽动物?」,并将语音输入301提供给指代检测器202进行处理。

口语输入201在口语输入301中包括诸如「那是什麽动物?」的请求。语音输入201除了请求之外同时包括音频。例如,口头输入201可以包括「嘿,看看那个,那是什麽动物是?」。

指代检测器202确定口头输入201是否包括请求。指代检测器202对口语输入201执行自动语音识别和/或自然语言处理,以确定口语输入201是否包括请求。另外,当口语输入201包括请求时,指代检测器202对口语输入201执行自动语音识别和/或自然语言处理,以确定口语输入201的请求。

在一个实施例中,确定语音输入201是否包括请求包括对语音输入201执行自动语音识别(ASR)。具体地,指代检测器202可以包括一个或多个ASR系统,其处理通过电子设备100的输入设备(例如麦克风)接收的语音输入201。ASR系统从语音输入中提取代表性特徵。例如,ASR系统预处理器对语音输入201执行傅里叶变换,以提取将语音输入表徵为代表性多维向量序列的频谱特徵。

另外,指代检测器202的每个ASR系统包括一个或多个语音识别模型,并实现一个或更多个语音识别引擎。语音识别模型的示例包括隐马尔可夫模型、高斯混合模型、深度神经网路模型、n元语言模型和其他统计模型。语音识别引擎的示例包括基於动态时间扭曲的引擎和基於加权有限状态变换器(WFST)的引擎。一个或多个语音识别模型和一个或更多个语音识别引擎用於处理前端语音预处理器的提取的代表性特徵,以产生中间识别结果,并最终产生文本识别结果。

在一个实施例中,确定口语输入201是否包括请求包括对口语输入201执行自然语言处理。特别地,一旦输入分析器202通过ASR产生包含文本串的识别结果,输入分析器就可以推断出口头输入201的意图。

指代检测器202产生语音输入的多个候选文本表示。每个候选文本表示是对应於口语输入201的单词或标记的序列。每个候选文本表示与语音识别置信分数相关联。基於语音识别置信度得分,指代检测器202对候选文本表示进行排序,并将n个最佳(例如,n个最高排序)候选文本表示提供给数字助手200的其他模块以供进一步处理。

确定口语输入201是否包括请求包括确定口语输入202是否包括歧义项。在一个示例中,歧义词是一个指示词。指示词指的是一个词或短语,它模糊地指代诸如对象、时间、人或地点之类的东西。示例性指示指代包括但不限於,this,here,there,then,these,them,he,she等,特别是当与诸如问题「这是什麽?」、「那在哪里?」和「他是谁?」之类的问题一起使用时。

因此,指代检测器202确定请求是否包括一个或类似的单词。例如,在口语输入301中,「那是什麽动物?」指代检测器202可以通过ASR和/或NLP确定「那」是指代含义 。类似地,在口语输入401中,「沙发上方的那个是什麽?」指代检测器202确定「那个」是指示指代。在这两个示例中,指代检测器202可以确定「那个」是模糊的,因为用户输入不包括可以用「那个」或「这个」来指代的主题或对象

在一个实施例中,数字助手200接收图像输入203。图像输入203包括多个对象,例如图像输入300包括负鼠302和树303。作为另一示例,图像输入400包括绘画402和沙发403。

在一个实施例中,图像输入203可以包括虚拟现实、增强现实或增强虚拟现实中的电子设备100的视图。因此,包括在图像输入203中的一个或多个对象可以是为图像输入203创建或添加到图像输入203的虚拟对象。

在接收图像输入203之前,数字助手200确定是否调用电子设备100的摄像头。数字助手200基於用户是否选择了物理按钮或显示的按钮来确定是否调用电子设备100的摄像头。数字助手200基於音频输入201确定是否调用摄像头。

除了接收图像输入203之外,数字助手200同时可以检测与语音输入201相关联的手势。在一个实施例中,数字助手200通过检测图像输入203中的手势来检测与语音输入201相关联的手势。例如,当图像输入203是电子设备100的视图时,图像输入203可以包括用户的手指向一个或多个对象,同时提供语音输入201。

在一个实施例中,数字助手200使用电子设备100的另一感测器检测与语音输入201相关联的手势。电子设备100的其他感测器可以是陀螺仪、加速计或检测电子设备100移动的其他感测器。因此,数字助手200在接收语音输入201的同时,基於在陀螺仪、加速计或其他感测器处接收的数据来检测与语音输入201相关联的手势。

当电子设备100是诸如头戴式显示器的可穿戴设备时,用户可以朝可穿戴设备的视图中的对象点头。因此,电子设备100的陀螺仪、加速计等检测指示点头的数据。数字助手200然後可以基於由陀螺仪或加速计检测到的数据来确定用户在哪个方向点头、他们点头的程度以及在用户点头的方向上图像输入203中存在哪些对象。

类似於上面讨论,数字助手200可以检测与语音输入201相关联的用户注视。例如,当电子设备100是诸如头戴式显示器的可穿戴设备时,电子设备100的视图同时是佩戴电子设备100用户的视图。因此,数字助手200可以将与语音输入201相关联的用户注视确定为与语音输入202一起接收的图像输入203。

数字助手200可以通过执行诸如边缘检测、边缘提取、图像分割、纹理分析、运动分析等图像处理技术来从图像输入203确定基本图像特徵。基本图像特徵包括但不限於图像中的对象、图像中的文本、用户注视、用户的手势以及在接收图像输入203和/或语音输入201时与电子设备相关联的情景数据。

例如,当数字助手200接收到图像输入300时,数字助手200可以确定复杂的图像特徵,包括负鼠302靠近树303、负鼠302在树303的右侧、负鼠303不在树303中、用户比负鼠302更靠近树303等。又如,数字助手200可以确定复杂的图像特徵,包括图片402在沙发403上方、沙发403靠墙、绘画402靠近沙发403等。

数字助手200向指代分类器204提供语音输入201和图像输入203,使得指代分类器204可以基於语音输入201的请求和图像输入204的请求从多个指代解析模块中选择指代解析模块。

如图2所示,多个指代解析模块包括文本指代解析模块206、基本视觉指代解析模块208和复杂视觉指代解析组件210。除了语音输入201和图像输入203之外,数字助手200同时向指代分类器204提供用户和数字助手200之间的基本图像特徵、复杂图像特徵和历史交互数据。

指代分类器204通过确定哪个指代解析模块将能够完成对象确定过程,从文本指代解析模块206、基本视觉指代解析模块208和复杂视觉指代解析组件210中进行选择。文本指代解析模块206、基本视觉指代解析模块208和复杂视觉指代解析模型210中的每一个都可以通过检查不同的输入和因素来完成对象确定过程,以确定用户正在用语音输入201指代图像输入203的哪个对象。

因此,指代分类器204通过确定当前输入集合中存在哪些输入和/或因素,从而确定三个指代解析模块中的哪一个最有可能完成对象确定过程,并选择三个指代分辨模块中的一个或多个。在一个实施例中,指代分类器204对文本指代解析模块206、基本视觉指代解析模块208或复杂视觉指代解析模型210的选择基於由指代分类器204确定的多个置信度分数。

指代分类器204可以基於语音输入201、图像输入203、历史交互数据、基本图像特徵和/或复杂图像特徵来确定置信度分数。例如,指代分类器204可以将某些权重或值分配给在口语输入201中出现或不出现的单词。类似地,指代分类器204可以基於出现在图像输入203中的某些基本或复杂图像特徵以及语音输入201是否指代一个或多个基本或复杂的图像特徵来分配权重。

因此,指代分类器204可以基於分配给这些因素中的每一个的一个或多个权重来计算置信度分数,以及复杂视觉指代解析模块210与多个置信度分数中的不同置信度分数相关联。

与文本指代解析模块206相关联的置信度分数是可以基於口头输入201和历史交互数据来完成对象确定过程的可能性。例如,当用户提供包括请求「它们吃什麽?」的口头输入,并且数字助手200接收到不包括任何对象或图像特徵的图像输入时,指代分类器204可以确定用户打算指代与数字助手200的过去交互。

因此,指代分类器204可以基於「它们吃什麽?」的当前口语输入和存储在实体资料库212中的关系/历史交互来确定对象确定过程是否可能完成。因此,指代分类器204可以基於口头输入201和历史交互数据以及因此与文本指代解析模块206相关联的高置信度来计算对象确定过程可以完成的高可能性。

与基本视觉指代解析模块208相关联的置信度分数是可以至少基於语音输入201和由数字助手200确定的基本图像特徵来完成对象确定过程的可能性。例如,当用户提供语音输入301「那是什麽动物?」,并且数字助手200接收图像输入300时,数字助手200可以确定图像输入300的基本图像特徵包括负鼠302和树303。

所以,指代分类器204可以进行确定,因为在输入中提供了单词「动物」,并且存在作为图像输入300中包括的动物的对象(例如负鼠302),所以很可能可以基於语音输入和基本图像特徵来完成对象确定过程。

因此,指代分类器204可以基於语音输入201和图像输入300以及因此与基本视觉指代解析模块208相关联的高置信度来计算可以完成对象确定过程的高可能性。

除了语音输入201和基本图像特徵之外,与基本视觉指代解析模块208相关联的置信度分数同时可以考虑是否能够基於历史交互数据来完成对象确定过程。例如,当用户提供语音输入「那一个呢?」时,数字助手200可以接收包括浣熊的基本图像特徵的图像输入。指代分类器204然後可以基於输入「那一个」确定用户正在指代与数字助手200的先前对话。…

No Thumbnail

轻文书、娱乐休闲都好用的 iPad 保护套 MAGEASY VIVAZ+ – 苹果迷 APPLEFANS

当 iPadOS 16 正式推出之後,Apple 让 iPad 与 Mac 之间的距离越来越近,所以对於平常不太需要长时间使用电脑工作的朋友,拥有一台 iPad 就能达到一机两用的效果,偶尔需要工作时能化身做为轻文书工作机,亦或者做为放松休闲时的娱乐机,为了让一机两用变得更好用,顺势帮 iPad 挑选一个 可拆式 又能 磁吸 的 iPad 保护殻,不仅能符合多种使用情境,也方便未来的扩充使用,  MAGEASY VIVAZ+ 可拆式 多角度支架透明保护套就符合这需求,这篇内容我们将体验它在我们的生活、工作之中,到底用起来如何呢?继续往下看吧!

MAGEASY 可拆式 多角度支架透明保护套 – VIVAZ+系列

每一台 iPad 都应该拥有一个适合自己使用情境的保护殻和支架,而这两个东西如果是结合在一起就更棒了!这次我们体验的 MAGEASY VIVAZ+ iPad 可拆式多角度支架透明保护套,它不仅可以给 iPad 应有的保护力,还能折成五种不同的角度,符合书写、画画、视讯等不同情境使用。

这款专属 iPad 的 …

No Thumbnail

Google 研发两款 5 奈米伺服器处理器,预计 2024 年交台积电生产

外媒引用知情人士消息,Google 研发资料中心处理器取得进展,代表可能 2025 年开始使用新处理器,是积极寻找击败对手亚马逊云端服务(AWS)的关键。新处理器预定由台积电生产。台积电照例没有回覆。

The Information 报导,Google 伺服器处理器团队正在开发两款采 ARM 架构的 5 奈米处理器。代号 Maple 采迈威尔 (Marvell Technology Group) 现成设计,刚完成设计交由台积电试产。另一款代号 Cypress 由以色列团队开发设计。

Google 客制化伺服器处理器将在 2024 下半年量产,最早 2025 年部署自家资料中心。Google 也与微软竞争人工智慧 (AI) 应用,将来新处理器加入後,能为 Google 人工智慧应用增力。

Google 斥资数十亿美元研发人工智慧和收购公司後,却被微软最近投资的人工智慧公司 OpenAI 抢走风头。OpenAI 新人工智慧工具 ChatGPT 最近爆红,公布不到一周就超过 100 万用户;两个月後月活跃用户达 …

NASA对重新设计的RS-25月球火箭发动机进行了测试

美国宇航局为太空发射系统(SLS)火箭的未来飞行新近重新设计的RS-25发动机,於2月8日在该机构位於密西西比州圣路易斯湾附近的斯坦尼斯航天中心进行了今年的首次热火测试。

这一系列的测试支持了SLS发动机主要承包商Aerojet Rocketdyne公司的新RS-25发动机的生产。新发动机将有助於为未来的阿特米斯任务提供动力,预计从Artemis V任务开始。

2023年2月8日,美国宇航局在密西西比州南部的斯坦尼斯航天中心的弗雷德-海斯试验台上进行RS-25热火试验。资料来源:美国宇航局/斯坦尼斯

在弗雷德-海斯试验台上的单引擎热火是在2022年的信心测试之後进行的,它证实了所有的准备工作都可以进行认证。

在最新的测试中,工程师们对RS-25发动机进行了大约8分半钟(500秒)的全推力点火,与发动机必须运行的时间相同,以帮助SLS进入太空。在测试的大部分时间里,RS-25发动机还以111%的功率运行,与帮助SLS升空所需的水平相同。这次测试采用了一系列新的组件,其中大部分是为12月的热火测试安装的。还有一个部件–一个新的喷嘴是在最近一次热火试验之前安装的。

2023年2月8日,在密西西比州南部的斯坦尼斯航天中心的弗雷德-海斯试验台上,一台远程摄像机提供了RS-25热火的特写视图。资料来源:美国宇航局/斯坦尼斯

四台RS-25发动机同时点火,在发射时产生160万磅的推力,在上升过程中产生200万磅的推力,为每次SLS飞行提供动力。美国宇航局和Aerojet Rocketdyne公司对太空梭计划中剩余的16台发动机进行了改装,这些发动机在斯坦尼斯被证明可以用於Artemis任务I至IV。

每台帮助SLS飞行的RS-25发动机都将在NASA斯坦尼斯进行测试。RS-25的测试是由NASA、Aerojet Rocketdyne和Syncom Space Services公司的联合团队进行。Syncom空间服务公司是斯坦尼斯设施和运营的主要承包商。

通过Artemis任务,美国宇航局将让第一位女性和第一位有色人种登陆月球表面,为长期的月球存在铺平道路,并作为通往火星的垫脚石。

喜欢这篇文章吗?立刻分享出去让更多人知道吧!

本站内容充实丰富,博大精深,小编精选每日热门资讯,随时更新,点击「抢先收到最新资讯」浏览吧!

请您继续阅读更多来自 cnBeta 的精彩文章:

※为什麽免疫疗法不能对所有乳腺癌起作用?
※研究:最常见的抗生素药物可能对儿童造成永久性的副作用…

No Thumbnail

微软终於开发适用 M1 Mac 的原生 Skype 版本 – 苹果迷 APPLEFANS

自从 Apple 在 2020 年首次推出搭载自家晶片的 M1 Mac ,不论是效能或者使用者体验都令消费者满意,也逼着各家软体厂商纷纷跟进提升自家软体能适用 M1 Mac。然而经过两年多的时间,微软终於开发适用 Apple Silicon 的 Skype 版本。

微软开始为 M1 Mac 测试原生 Skype 版本

Apple 推出自家 M1 晶片之後,各家软体厂商为了要让应用程式可以在 M1 晶片运行时达到流畅性能,纷纷都推出适用於 M1 的原生版本,而现在微软在自家 Skype 部落格上发文表示:Skype 终於释出适用 Apple M1 Mac 的版本,它速度快了 3 倍! 告别迟钝和缓慢的通话体验,并提升音讯和影片的品质。 

No Thumbnail

Bill Gates 说 ChatGPT 可以教数学,也可做医疗顾问

Bill Gates 说 ChatGPT 可以教数学,也可做医疗顾问,07/02/2023, Advance Iverson,135,,

Microsoft 联合创始人Bill Gates声称,他对人工智能聊天机械人 ChatGPT 以及过去一年在人工智能领域取得的诸多成就感到非常兴奋。 他还针对 ChatGPT 的潜在用途提出了三个建议:作为数学导师,作为一些缺乏医疗条件的非洲人的医疗顾问,以及像莎士比亚一样写诗。

Bill Gates表示,这种类型的人工智能可以充当数学导师,帮助学生加强学习。 他们还可以担任医疗顾问,为一些经常一辈子不看医生的非洲人提供医疗建议。 目前,没有足够的白领从事这种“有价值的职业”,而人工智能可以帮助满足这些需求。

除了上述两种用途外, Bill Gates还提到了他最喜欢用 ChatGPT 做的“有趣的事情”,包括与朋友一起写诗,尽管他尝试 ChatGPT 的主要原因是“为了更严肃的目的”。 “事实上,你可以告诉 ChatGPT ‘像莎士比亚一样写诗’,它确实做到了,AI 具有创造力真的很有趣,” Bill Gates说,并补充说,在他读完 ChatGPT 写的诗後,他承认他不能自己写。

尽管 Bill Gates在 2020 年离开了 Microsoft …