Kezdőlap
Értesítés
Profil
Népszerű cikkek
Hírek
Könyvjelzők
Előzmények
Alkotói központ
Beállítások
HWF0323
21
Bejegyzések
HWF0323
Jelentés
Felhasználó tiltása
Követés
VitoHuang Mercan capital Asset Limited 主业务: Web3全案服务(香港1469牌照)、量化资管(香港9号牌照)、股票/Token市值管理、全球流量和公链基金合作、Web3生态服务。
6
Követés
44
Követők
32
Kedvelve
8
Megosztva
Bejegyzések
Rögzítve
HWF0323
·
--
OORT 登陆深圳数据交易所,扩大其亚洲人工智能市场影响力#oort #depin #ai 通过在深圳数据交易所上市,OORT 将向蓬勃发展的 AI 公司市场提供其产品。 作为一个去中心化AI的云平台,OORT欣然宣布将入驻中国领先的头部数据交易平台——深圳数据交易所。这将使OORT能够向亚洲范围内的大量AI公司提供其产品和服务,包括其旗舰产品OORT DataHub和OORT AI。 深圳数据交易所:数据创新的中心 深圳数据交易所为深圳交易集团(Shenzhen Exchange Group)下属企业,以建设国家级数据交易所为目标,是构建数据要素跨域、跨境流通的全国性交易平台,探索适应中国数字经济发展的数据要素市场化配置示范路径和交易样板。 深圳数据交易所交易额于2024年6月突破百亿大关,交易规模达到105.39亿元,是中国第一个突破百亿交易额的数据交易平台。截至2024年6月,深圳数据交易所已上市标的2263个,覆盖超过70个行业,265个应用场景,形成立足深圳、辐射全国、面向世界的数据生态交易圈。 在跨境业务领域,深圳数据交易所从数据跨境路径打通、基础设施建设、生态引流及境外合作等方面入手,积极推动数据跨境业务有序发展。 深圳数据交易所副总经理赵阳表示: OORT凭借其在人工智能、区块链等领域先进的理念与技术,将为客户创造更大的发展机遇和商业价值;欢迎全球更多优秀的数据服务商入驻深圳数据交易所,互利共赢、共同发展。 OORT 的使命:赋能 AI 公司 通过在深圳数据交易所上市,OORT 将向蓬勃发展的 AI 公司市场提供其产品。中国对 AI 创新的大力支持催生了一个繁荣的 AI 初创企业生态系统,这为 OORT 提供了扩大影响力和业务范围的重要机会。OORT Datahub 提供的海量 AI 数据集,将为 AI 公司训练模型提供丰富的资源,以支持其创新和成长。此外,OORT AI 解决方案可以帮助公司轻松地将 AI 助手部署到他们的业务中。 “在深圳数据交易所上市是我们发展历程中的一个重要里程碑,”OORT 创始人兼首席执行官 Max Li 表示。“中国拥有全球最多的 AI 公司,数据交易所为 OORT 的产品提供了一个强大的平台,为这些公司的发展和公共利益的增长提供支持。” 关于 OORT OORT已经建立了世界上最大的去中心化云基础设施之一,其网络节点覆盖超过100个国家,并实现了数百万美元的收入。OORT的核心技术发表于全球顶尖的学术期刊,并获得美国专利。其全球知名的客户和合作伙伴包括诸多行业巨头,如联想图像、戴尔、腾讯云和BNB链等。OORT拥有一支经验丰富且执行力强的团队,以及一个由全球专家组成的顶级咨询委员会。介于此,OORT在人工智能的DePin领域建立并稳固了其全球领先的地位。 OORT是一个去中心化数据云平台,旨在整合全球的计算和存储资源,最大化隐私和成本效益,为生成型人工智能和数据驱动型业务提供一套企业级的,去中心化的解决方案。 简而言之,OORT 是一个集数据收集、数据存储、数据预处理、数据计算、AI 模型设计 / 训练 / 微调及部署于一身的一站式去中心化 AI 解决方案。项目旨在结合 AI 与 DePIN,一方面通过完善的激励模型鼓励更广泛的用户以去中心化的方式参与贡献,另一方面为每位用户带来低门槛、低成本、隐私保护的 AI 服务,从而打造一个以信任为基础的全球 AI 生态系统。 而且OORT的核心技术得到了美国专利和学术出版物的背书,并已与 40 多个项目/公司以及 20 多所美国名牌大学(例如哈佛、麻省理工、芝加哥大学、哥伦比亚大学,杜克大学,密歇根大学,西北大学,纽约大学等)建立了牢固的合作伙伴或客户关系。 投资机构:Taisu Ventures(原Emurgo - Cardano Venture Arm-ADA公链)、Aves Lair、Microsoft(微软)、Google(谷歌)、Red Beard Ventures(A16Z和Animoca Brands投资的基金)、Angelist、Trinity Venture Capital、Redline DAO、Sanctor Capital、Waterdrip Capital、LinkVC 以及来自JP Morgan、哥伦比亚大学、康奈尔大学,Ausum Ventures和ISKER Group等机构的个人投资者。 40+渠道·生态·客户: BNB Chain-BNB Greenfield (币安)、DEII(戴尔)、Lenovo Image(联想图像)、Tencent(腾讯)、Alibaba Cloud(阿里)、Seagate(希捷)、Akamai(阿卡迈)、 Neo、IoTeX、Mind Network、Storj、Space and Time、Poolz Finance、OORT SWAP、iPolloverse、Grown、Crust、Sinso、PoP Planet、Parallell、Revolution NFT、Coresky NFT、Mises、Appsco、NumenCyber、SPEARHEAD、Layerr、Uverse、Y0 NFT、ThreeFold、IOV Labs、blue world、Crypto Legacy、Supermoon Camp、Walken、Clocr、Midas、 iCrypto World、Verida、404DAO、Midasreless、Supermoon Camp、1024bank、etc 、FilSwan、AFRICA2.0(非洲2.0)、Ivy League(常春藤盟校)、Together Labs、Finstreet等 声明:本文转载自【搜狐】。
OORT 登陆深圳数据交易所,扩大其亚洲人工智能市场影响力
#oort
#depin
#ai
通过在深圳数据交易所上市,OORT 将向蓬勃发展的 AI 公司市场提供其产品。
作为一个去中心化AI的云平台,OORT欣然宣布将入驻中国领先的头部数据交易平台——深圳数据交易所。这将使OORT能够向亚洲范围内的大量AI公司提供其产品和服务,包括其旗舰产品OORT DataHub和OORT AI。
深圳数据交易所:数据创新的中心
深圳数据交易所为深圳交易集团(Shenzhen Exchange Group)下属企业,以建设国家级数据交易所为目标,是构建数据要素跨域、跨境流通的全国性交易平台,探索适应中国数字经济发展的数据要素市场化配置示范路径和交易样板。
深圳数据交易所交易额于2024年6月突破百亿大关,交易规模达到105.39亿元,是中国第一个突破百亿交易额的数据交易平台。截至2024年6月,深圳数据交易所已上市标的2263个,覆盖超过70个行业,265个应用场景,形成立足深圳、辐射全国、面向世界的数据生态交易圈。
在跨境业务领域,深圳数据交易所从数据跨境路径打通、基础设施建设、生态引流及境外合作等方面入手,积极推动数据跨境业务有序发展。
深圳数据交易所副总经理赵阳表示: OORT凭借其在人工智能、区块链等领域先进的理念与技术,将为客户创造更大的发展机遇和商业价值;欢迎全球更多优秀的数据服务商入驻深圳数据交易所,互利共赢、共同发展。
OORT 的使命:赋能 AI 公司
通过在深圳数据交易所上市,OORT 将向蓬勃发展的 AI 公司市场提供其产品。中国对 AI 创新的大力支持催生了一个繁荣的 AI 初创企业生态系统,这为 OORT 提供了扩大影响力和业务范围的重要机会。OORT Datahub 提供的海量 AI 数据集,将为 AI 公司训练模型提供丰富的资源,以支持其创新和成长。此外,OORT AI 解决方案可以帮助公司轻松地将 AI 助手部署到他们的业务中。
“在深圳数据交易所上市是我们发展历程中的一个重要里程碑,”OORT 创始人兼首席执行官 Max Li 表示。“中国拥有全球最多的 AI 公司,数据交易所为 OORT 的产品提供了一个强大的平台,为这些公司的发展和公共利益的增长提供支持。”
关于 OORT
OORT已经建立了世界上最大的去中心化云基础设施之一,其网络节点覆盖超过100个国家,并实现了数百万美元的收入。OORT的核心技术发表于全球顶尖的学术期刊,并获得美国专利。其全球知名的客户和合作伙伴包括诸多行业巨头,如联想图像、戴尔、腾讯云和BNB链等。OORT拥有一支经验丰富且执行力强的团队,以及一个由全球专家组成的顶级咨询委员会。介于此,OORT在人工智能的DePin领域建立并稳固了其全球领先的地位。
OORT是一个去中心化数据云平台,旨在整合全球的计算和存储资源,最大化隐私和成本效益,为生成型人工智能和数据驱动型业务提供一套企业级的,去中心化的解决方案。
简而言之,OORT 是一个集数据收集、数据存储、数据预处理、数据计算、AI 模型设计 / 训练 / 微调及部署于一身的一站式去中心化 AI 解决方案。项目旨在结合 AI 与 DePIN,一方面通过完善的激励模型鼓励更广泛的用户以去中心化的方式参与贡献,另一方面为每位用户带来低门槛、低成本、隐私保护的 AI 服务,从而打造一个以信任为基础的全球 AI 生态系统。
而且OORT的核心技术得到了美国专利和学术出版物的背书,并已与 40 多个项目/公司以及 20 多所美国名牌大学(例如哈佛、麻省理工、芝加哥大学、哥伦比亚大学,杜克大学,密歇根大学,西北大学,纽约大学等)建立了牢固的合作伙伴或客户关系。
投资机构:Taisu Ventures(原Emurgo - Cardano Venture Arm-ADA公链)、Aves Lair、Microsoft(微软)、Google(谷歌)、Red Beard Ventures(A16Z和Animoca Brands投资的基金)、Angelist、Trinity Venture Capital、Redline DAO、Sanctor Capital、Waterdrip Capital、LinkVC 以及来自JP Morgan、哥伦比亚大学、康奈尔大学,Ausum Ventures和ISKER Group等机构的个人投资者。
40+渠道·生态·客户:
BNB Chain-BNB Greenfield (币安)、DEII(戴尔)、Lenovo Image(联想图像)、Tencent(腾讯)、Alibaba Cloud(阿里)、Seagate(希捷)、Akamai(阿卡迈)、 Neo、IoTeX、Mind Network、Storj、Space and Time、Poolz Finance、OORT SWAP、iPolloverse、Grown、Crust、Sinso、PoP Planet、Parallell、Revolution NFT、Coresky NFT、Mises、Appsco、NumenCyber、SPEARHEAD、Layerr、Uverse、Y0 NFT、ThreeFold、IOV Labs、blue world、Crypto Legacy、Supermoon Camp、Walken、Clocr、Midas、 iCrypto World、Verida、404DAO、Midasreless、Supermoon Camp、1024bank、etc 、FilSwan、AFRICA2.0(非洲2.0)、Ivy League(常春藤盟校)、Together Labs、Finstreet等
声明:本文转载自【搜狐】。
BNB
NEO
IOTX
HWF0323
·
--
Medvejellegű
#财富自由 #财富的真相 一张中金2025财富报告的数据,引人深思。 传统财富结构逐渐固化:国企占据国家资产的45.6%,富豪阶层持有36.7%,中产仅占13.7%,而13亿普通人只共享3%的资产。财富分布如同一个明显的金字塔,上升通道日益狭窄。 而在这样的格局中,加密资产或许正在打开一扇新窗。它不依赖于传统体系的积累,不以身份或资源为唯一门槛,而是凭借认知、风险承受力与技术理解,重塑财富的可能性。比特币、以太坊乃至各类新兴资产,正构建起一个平行于传统金融的“数字财富池”。 这并不意味着加密世界没有风险与泡沫,但它至少提供了一种重新分配、重新想象财富的路径。未来十年,真正的财富转折点,或许就藏在传统资产与加密资产的交汇处。 你是否也在观望,或已悄然布局? $BTC
#财富自由
#财富的真相
一张中金2025财富报告的数据,引人深思。
传统财富结构逐渐固化:国企占据国家资产的45.6%,富豪阶层持有36.7%,中产仅占13.7%,而13亿普通人只共享3%的资产。财富分布如同一个明显的金字塔,上升通道日益狭窄。
而在这样的格局中,加密资产或许正在打开一扇新窗。它不依赖于传统体系的积累,不以身份或资源为唯一门槛,而是凭借认知、风险承受力与技术理解,重塑财富的可能性。比特币、以太坊乃至各类新兴资产,正构建起一个平行于传统金融的“数字财富池”。
这并不意味着加密世界没有风险与泡沫,但它至少提供了一种重新分配、重新想象财富的路径。未来十年,真正的财富转折点,或许就藏在传统资产与加密资产的交汇处。
你是否也在观望,或已悄然布局?
$BTC
BTC
ETH
HWF0323
·
--
$WLFI 兄弟们,我先平仓了。
$WLFI
兄弟们,我先平仓了。
WLFI
HWF0323
·
--
$WLFI 同一个时间段,不同交易所的价格走势图!
$WLFI
同一个时间段,不同交易所的价格走势图!
WLFI
HWF0323
·
--
到底是谁在出货?#Tether8日增发50亿枚USDT
到底是谁在出货?
#Tether8日增发50亿枚USDT
HWF0323
·
--
#公募基金 #基金认购费 #链上收益 #PankaceSwap 我实在没搞明白公募基金降低认购费的意义在哪里? 加密量化年化收益超20%的产品多如牛毛,借贷与质押年化收益超50%的产品以上比比皆是。 传统金融像极了老美的航母,看着威风,实则破败不堪!
#公募基金
#基金认购费
#链上收益
#PankaceSwap
我实在没搞明白公募基金降低认购费的意义在哪里?
加密量化年化收益超20%的产品多如牛毛,借贷与质押年化收益超50%的产品以上比比皆是。
传统金融像极了老美的航母,看着威风,实则破败不堪!
HWF0323
·
--
#AskBinance @binancezh 关于现实世界资产(RWA)“股票代币化”实践中,会出现链上资产价格与传统证券交易所价格脱锚现象,币安是如何通过预言机和合约安全技术解决这方面的问题?
#AskBinance
@币安Binance华语
关于现实世界资产(RWA)“股票代币化”实践中,会出现链上资产价格与传统证券交易所价格脱锚现象,币安是如何通过预言机和合约安全技术解决这方面的问题?
HWF0323
·
--
Medvejellegű
$FTT 没有交易量
$FTT
没有交易量
FTT
HWF0323
·
--
Medvejellegű
#CFX #树图 $CFX {spot}(CFXUSDT) 树图链(conflux)能否借助 #稳定币 起飞🛫?
#CFX
#树图
$CFX
树图链(conflux)能否借助
#稳定币
起飞🛫?
CFX
HWF0323
·
--
Medvejellegű
$FTT 即将0.00001$
$FTT
即将0.00001$
FTT
HWF0323
·
--
$FTT 即将跟随BTC大暴跌,BTC下跌📉2%,FTT将下跌📉20%
$FTT
即将跟随BTC大暴跌,BTC下跌📉2%,FTT将下跌📉20%
FTT
BTC
HWF0323
·
--
$FTT 即将归零
$FTT
即将归零
FTT
HWF0323
·
--
#ftt 预计将跌回0.7$,静待发生。
#ftt
预计将跌回0.7$,静待发生。
FTT
HWF0323
·
--
#点滴财经 #Uweb #RWA #AI 2025「点滴财经」百城巡回深圳站启幕 2025年5月17日 13:30-18:00 深圳市南山区深圳湾科技生态园
#点滴财经
#Uweb
#RWA
#AI
2025「点滴财经」百城巡回深圳站启幕
2025年5月17日 13:30-18:00
深圳市南山区深圳湾科技生态园
AI
HWF0323
·
--
#美国加征关税 #加密市场反弹 #香港Web3嘉年华 @heyi $SCR 第一次在现场听到一姐的声音!
#美国加征关税
#加密市场反弹
#香港Web3嘉年华
@Yi He
$SCR
第一次在现场听到一姐的声音!
B
SCR/USDT
Ár
0,267
SCR
HWF0323
·
--
#香港Web3嘉年华 #HashKey 参加活动现场 #BTC
#香港Web3嘉年华
#HashKey
参加活动现场
#BTC
HWF0323
·
--
#Avalanche 昨晚由Avalanche在深圳举办的线下沙龙活动举办的非常成功!感谢主办方的BBQ!#AVAX
#Avalanche
昨晚由Avalanche在深圳举办的线下沙龙活动举办的非常成功!感谢主办方的BBQ!
#AVAX
AVAX
HWF0323
·
--
沈阳同11家数据标注产业企业签约#oort #depin 10月22日,由国家数据局数字科技和基础设施建设司指导,国家数据局人工智能专班主办的首届“数据标注产业大会暨供需对接会”在北京召开。沈阳市数据局在国家数据局数据标注供需对接会上发布数据标注产业图谱,并成功与11家数据标注、人工智能领域知名企业签订合作框架协议。 当天上午,国家数据局发布由沈阳市数据局会同中国信通院、中国电信、中国电子、航天科工网络信息发展有限公司编制的《人工智能数据标注产业图谱》。图谱共收录来自全国各地500余家深耕数据标注产业链上下游企业,覆盖超过16个行业领域。《人工智能数据标注产业图谱》由资源提供方、数据标注核心服务方、配套支撑方三部分组成。 下午,在大会数据标注基地企业招引推介环节,沈阳市数据局局长莽琦向参会单位重点推介了沈阳的发展环境和基础优势,详细解读了数据标注基地面向企业的招商政策,分享了基地建设的最新进展,并公布与各界合作的诉求,引发与会企业代表广泛关注和热议。经充分对接,沈阳市数据局与北京林克艾普科技有限公司、北京四维图新科技股份有限公司等11家企事业单位签订合作框架协议,涉及数据标注基地技术创新、语料供给、标准制定和园区建设等。近期,皇姑、浑南、和平、大东、铁西5个地区将与中国网络视听协会网络音频工作委员会、砺英数智(北京)数据技术有限公司等企事业单位签订商业合同。
沈阳同11家数据标注产业企业签约
#oort
#depin
10月22日,由国家数据局数字科技和基础设施建设司指导,国家数据局人工智能专班主办的首届“数据标注产业大会暨供需对接会”在北京召开。沈阳市数据局在国家数据局数据标注供需对接会上发布数据标注产业图谱,并成功与11家数据标注、人工智能领域知名企业签订合作框架协议。
当天上午,国家数据局发布由沈阳市数据局会同中国信通院、中国电信、中国电子、航天科工网络信息发展有限公司编制的《人工智能数据标注产业图谱》。图谱共收录来自全国各地500余家深耕数据标注产业链上下游企业,覆盖超过16个行业领域。《人工智能数据标注产业图谱》由资源提供方、数据标注核心服务方、配套支撑方三部分组成。
下午,在大会数据标注基地企业招引推介环节,沈阳市数据局局长莽琦向参会单位重点推介了沈阳的发展环境和基础优势,详细解读了数据标注基地面向企业的招商政策,分享了基地建设的最新进展,并公布与各界合作的诉求,引发与会企业代表广泛关注和热议。经充分对接,沈阳市数据局与北京林克艾普科技有限公司、北京四维图新科技股份有限公司等11家企事业单位签订合作框架协议,涉及数据标注基地技术创新、语料供给、标准制定和园区建设等。近期,皇姑、浑南、和平、大东、铁西5个地区将与中国网络视听协会网络音频工作委员会、砺英数智(北京)数据技术有限公司等企事业单位签订商业合同。
HWF0323
·
--
什么是AI训练中的数据标注?一、什么是数据标注 首先谈谈什么是数据标注。数据标注有许多类型,如分类、画框、注释、标记等等,我们会在下面详谈。 要理解数据标注,得先理解AI其实是部分替代人的认知功能。回想一下我们是如何学习的,例如我们学习认识苹果,那么就需要有人拿着一个苹果到你面前告诉你,这是一个苹果。然后以后你遇到了苹果,你才知道这玩意儿叫做“苹果”。 类比机器学习,我们要教他认识一个苹果,你直接给它一张苹果的图片,它是完全不知道这是个啥玩意的。我们得先有苹果的图片,上面标注着“苹果”两个字,然后机器通过学习了大量的图片中的特征,这时候再给机器任意一张苹果的图片,它就能认出来了。 这边可以顺带提一下训练集和测试集的概念。训练集和测试集都是标注过的数据,还是以苹果为例子,假设我们有1000张标注着“苹果”的图片,那么我们可以拿900涨作为训练集,100张作为测试集。机器从900张苹果的图片中学习得到一个模型,然后我们将剩下的100张机器没有见过的图片去给它识别,然后我们就能够得到这个模型的准确率了。想想我们上学的时候,考试的内容总是不会和我们平时的作业一样,也只有这样才能测试出学习的真正效果,这样就不难理解为什么要划分一个测试集了。 我们知道机器学习分为有监督学习和无监督学习。无监督学习的效果是不可控的,常常是被用来做探索性的实验。而在实际产品应用中,通常使用的是有监督学习。有监督的机器学习就需要有标注的数据来作为先验经验。 在进行数据标注之前,我们首先要对数据进行清洗,得到符合我们要求的数据。数据的清洗包括去除无效的数据、整理成规整的格式等等。具体的数据要求可以和算法人员确认。 二、常见的几种数据标注类型 1.分类标注:分类标注,就是我们常见的打标签。一般是从既定的标签中选择数据对应的标签,是封闭集合。如下图,一张图就可以有很多分类/标签:成人、女、黄种人、长发等。对于文字,可以标注主语、谓语、宾语,名词动词等。 适用:文本、图像、语音、视频 应用:脸龄识别,情绪识别,性别识别 2.标框标注:机器视觉中的标框标注,很容易理解,就是框选要检测的对象。如人脸识别,首先要先把人脸的位置确定下来。行人识别,如下图。 适用:图像 应用:人脸识别,物品识别 3.区域标注:相比于标框标注,区域标注要求更加精确。边缘可以是柔性的。如自动驾驶中的道路识别。 适用:图像 应用:自动驾驶 4.描点标注:一些对于特征要求细致的应用中常常需要描点标注。人脸识别、骨骼识别等。 适用:图像 应用:人脸识别、骨骼识别 5.其他标注:标注的类型除了上面几种常见,还有很多个性化的。根据不同的需求则需要不同的标注。如自动摘要,就需要标注文章的主要观点,这时候的标注严格上就不属于上面的任何一种了。(或则你把它归为分类也是可以的,只是标注主要观点就没有这么客观的标准,如果是标注苹果估计大多数人标注的结果都差不多。) 三、数据标注的过程 1.标注标准的确定 确定好标准是保证数据质量的关键一步,要保证有个可以参照的标准。一般可以: 设置标注样例、模版。例如颜色的标准比色卡。对于模棱两可的数据,设置统一处理方式,如可以弃用,或则统一标注。 参照的标准有时候还要考虑行业。以文本情感分析为例,“疤痕”一词,在心理学行业中,可能是个负面词,而在医疗行业则是一个中性词。 2.标注形式的确定 标注形式一般由算法人员制定,例如某些文本标注,问句识别,只需要对句子进行0或1的标注。是问句就标1,不是问句就标0。 3.标注工具的选择 标注的形式确定后,就是对标注工具的选择了。一般也是由算法人员提供。大公司可能会内部开发一个专门用于数据标注的可视化工具。如: 也有使用开源的数据标注工具的,如推荐 Github 上的小工具labelImg 四、数据标注产品的设计 结合自己做过一款数据标记工具谈谈设计数据标注工具的几个小技巧。 一个数据标注工具一般包含: 进度条:用来指示数据标注的进度。标注人员一般都是有任务量要求的,一方面方便标注人员查看进度,一方面方便统计。标注主体:这个可以根据标注形式进行设计,原则上是越简洁易用越好。根据标注所需要的注意力可以分为单个标注和多个标注的形式,可根据需求选择。数据导入导出功能:如果你的标注工具是直接数据对接到模型上的,可以不需要。收藏功能:这个可能是没有接触过数据标注的不会想到。标注人员常常会出现的一种情况就是疲劳,或者是遇到了那种模棱两可的数据,则可以先收藏,等后面再标。质检机制:在分发数据的时候,可以随机分发一些已经标注过的数据,来检测标注人员可靠性。
什么是AI训练中的数据标注?
一、什么是数据标注
首先谈谈什么是数据标注。数据标注有许多类型,如分类、画框、注释、标记等等,我们会在下面详谈。
要理解数据标注,得先理解AI其实是部分替代人的认知功能。回想一下我们是如何学习的,例如我们学习认识苹果,那么就需要有人拿着一个苹果到你面前告诉你,这是一个苹果。然后以后你遇到了苹果,你才知道这玩意儿叫做“苹果”。
类比机器学习,我们要教他认识一个苹果,你直接给它一张苹果的图片,它是完全不知道这是个啥玩意的。我们得先有苹果的图片,上面标注着“苹果”两个字,然后机器通过学习了大量的图片中的特征,这时候再给机器任意一张苹果的图片,它就能认出来了。
这边可以顺带提一下训练集和测试集的概念。训练集和测试集都是标注过的数据,还是以苹果为例子,假设我们有1000张标注着“苹果”的图片,那么我们可以拿900涨作为训练集,100张作为测试集。机器从900张苹果的图片中学习得到一个模型,然后我们将剩下的100张机器没有见过的图片去给它识别,然后我们就能够得到这个模型的准确率了。想想我们上学的时候,考试的内容总是不会和我们平时的作业一样,也只有这样才能测试出学习的真正效果,这样就不难理解为什么要划分一个测试集了。
我们知道机器学习分为有监督学习和无监督学习。无监督学习的效果是不可控的,常常是被用来做探索性的实验。而在实际产品应用中,通常使用的是有监督学习。有监督的机器学习就需要有标注的数据来作为先验经验。
在进行数据标注之前,我们首先要对数据进行清洗,得到符合我们要求的数据。数据的清洗包括去除无效的数据、整理成规整的格式等等。具体的数据要求可以和算法人员确认。
二、常见的几种数据标注类型
1.分类标注:分类标注,就是我们常见的打标签。一般是从既定的标签中选择数据对应的标签,是封闭集合。如下图,一张图就可以有很多分类/标签:成人、女、黄种人、长发等。对于文字,可以标注主语、谓语、宾语,名词动词等。
适用:文本、图像、语音、视频
应用:脸龄识别,情绪识别,性别识别
2.标框标注:机器视觉中的标框标注,很容易理解,就是框选要检测的对象。如人脸识别,首先要先把人脸的位置确定下来。行人识别,如下图。
适用:图像
应用:人脸识别,物品识别
3.区域标注:相比于标框标注,区域标注要求更加精确。边缘可以是柔性的。如自动驾驶中的道路识别。
适用:图像
应用:自动驾驶
4.描点标注:一些对于特征要求细致的应用中常常需要描点标注。人脸识别、骨骼识别等。
适用:图像
应用:人脸识别、骨骼识别
5.其他标注:标注的类型除了上面几种常见,还有很多个性化的。根据不同的需求则需要不同的标注。如自动摘要,就需要标注文章的主要观点,这时候的标注严格上就不属于上面的任何一种了。(或则你把它归为分类也是可以的,只是标注主要观点就没有这么客观的标准,如果是标注苹果估计大多数人标注的结果都差不多。)
三、数据标注的过程
1.标注标准的确定
确定好标准是保证数据质量的关键一步,要保证有个可以参照的标准。一般可以:
设置标注样例、模版。例如颜色的标准比色卡。对于模棱两可的数据,设置统一处理方式,如可以弃用,或则统一标注。
参照的标准有时候还要考虑行业。以文本情感分析为例,“疤痕”一词,在心理学行业中,可能是个负面词,而在医疗行业则是一个中性词。
2.标注形式的确定
标注形式一般由算法人员制定,例如某些文本标注,问句识别,只需要对句子进行0或1的标注。是问句就标1,不是问句就标0。
3.标注工具的选择
标注的形式确定后,就是对标注工具的选择了。一般也是由算法人员提供。大公司可能会内部开发一个专门用于数据标注的可视化工具。如:
也有使用开源的数据标注工具的,如推荐 Github 上的小工具labelImg
四、数据标注产品的设计
结合自己做过一款数据标记工具谈谈设计数据标注工具的几个小技巧。
一个数据标注工具一般包含:
进度条:用来指示数据标注的进度。标注人员一般都是有任务量要求的,一方面方便标注人员查看进度,一方面方便统计。标注主体:这个可以根据标注形式进行设计,原则上是越简洁易用越好。根据标注所需要的注意力可以分为单个标注和多个标注的形式,可根据需求选择。数据导入导出功能:如果你的标注工具是直接数据对接到模型上的,可以不需要。收藏功能:这个可能是没有接触过数据标注的不会想到。标注人员常常会出现的一种情况就是疲劳,或者是遇到了那种模棱两可的数据,则可以先收藏,等后面再标。质检机制:在分发数据的时候,可以随机分发一些已经标注过的数据,来检测标注人员可靠性。
HWF0323
·
--
oort:去中心化的数据标注#oort #数据标注 #ai #百倍币计划 为什么选择OORT DataHub?与传统数据标注有什么不同? OORT是一个去中心化数据云平台,旨在整合全球的计算和存储资源,最大化隐私和成本效益,为生成型人工智能和数据驱动型业务提供一套企业级的,去中心化的解决方案。 目前已经建立了世界上最大的去中心化云基础设施之一,其网络节点覆盖超过100个国家,并实现了数百万美元的收入,OORT的核心技术发表于全球顶尖的学术期刊,并获得美国专利。其全球知名的客户和合作伙伴包括诸多行业巨头,如联想图像、戴尔、腾讯云和BNB链等。OORT拥有一支经验丰富且执行力强的团队,以及一个由全球专家组成的顶级咨询委员会。介于此,OORT在人工智能的DePin领域建立并稳固了其全球领先的地位。 简而言之,OORT 是一个集数据收集、数据存储、数据预处理、数据计算、AI 模型设计 / 训练 / 微调及部署于一身的一站式去中心化 AI 解决方案。项目旨在结合 AI 与 DePIN,一方面通过完善的激励模型鼓励更广泛的用户以去中心化的方式参与贡献,另一方面为每位用户带来低门槛、低成本、隐私保护的 AI 服务,从而打造一个以信任为基础的全球 AI 生态系统。 OORT要构建一个人人贡献、人人设计、人人受益的 AI 世界,首先需要搭建框架,构建一个去中心化基础设施层,能够真正聚合 Web2 与 Web3 数据,并针对数据存储、数据调取、数据计算等方面实现真正的去中心化、高效透明且成本降低。具体实现上,OORT 推出开源 Layer 1 Olympus 协议并通过原生代币 OORT 实现激励闭环。
oort:去中心化的数据标注
#oort
#数据标注
#ai
#百倍币计划
为什么选择OORT DataHub?与传统数据标注有什么不同?
OORT是一个去中心化数据云平台,旨在整合全球的计算和存储资源,最大化隐私和成本效益,为生成型人工智能和数据驱动型业务提供一套企业级的,去中心化的解决方案。
目前已经建立了世界上最大的去中心化云基础设施之一,其网络节点覆盖超过100个国家,并实现了数百万美元的收入,OORT的核心技术发表于全球顶尖的学术期刊,并获得美国专利。其全球知名的客户和合作伙伴包括诸多行业巨头,如联想图像、戴尔、腾讯云和BNB链等。OORT拥有一支经验丰富且执行力强的团队,以及一个由全球专家组成的顶级咨询委员会。介于此,OORT在人工智能的DePin领域建立并稳固了其全球领先的地位。
简而言之,OORT 是一个集数据收集、数据存储、数据预处理、数据计算、AI 模型设计 / 训练 / 微调及部署于一身的一站式去中心化 AI 解决方案。项目旨在结合 AI 与 DePIN,一方面通过完善的激励模型鼓励更广泛的用户以去中心化的方式参与贡献,另一方面为每位用户带来低门槛、低成本、隐私保护的 AI 服务,从而打造一个以信任为基础的全球 AI 生态系统。
OORT要构建一个人人贡献、人人设计、人人受益的 AI 世界,首先需要搭建框架,构建一个去中心化基础设施层,能够真正聚合 Web2 与 Web3 数据,并针对数据存储、数据调取、数据计算等方面实现真正的去中心化、高效透明且成本降低。具体实现上,OORT 推出开源 Layer 1 Olympus 协议并通过原生代币 OORT 实现激励闭环。
BNB
A további tartalmak felfedezéséhez jelentkezz be
Bejelentkezés
Fedezd fel a legfrissebb kriptovaluta-híreket
⚡️ Vegyél részt a legfrissebb kriptovaluta megbeszéléseken
💬 Lépj kapcsolatba a kedvenc alkotóiddal
👍 Élvezd a téged érdeklő tartalmakat
E-mail-cím/telefonszám
Regisztráció
Bejelentkezés
Népszerű témák
MarketRally
1.8M megtekintés
11,689 beszélgető
THIS IS WHY BITCOIN DUMPED NON STOP FROM $126,000 TO $60,000.
Professor Of Chart By S
·
2 kedvelés
·
1.9k megtekintés
USIranStandoff
6.1M megtekintés
51,848 beszélgető
BitcoinGoogleSearchesSurge
469,653 megtekintés
5,631 beszélgető
Több megtekintése
Legfrissebb hírek
Trend Research Completes Ethereum Liquidation
--
U.S. President Trump Discusses Trade and Investment with Honduran President
--
Denmark and Greenland's Negotiations with the U.S. Fall Short of Expectations
--
Több megtekintése
Oldaltérkép
Egyéni sütibeállítások
Platform szerződési feltételek