links: Franklin Marshall Sac Chanel Chaussure Converse Nike France Abercrombie Longchamp Pas Cher Polo Ralph Lauren Sacoche Louis Vuitton Abercrombie Milano
打印文章
打印本文 打印本文  关闭窗口 关闭窗口  
新农业龙头采集行业数据实施特征标签工程
作者:张振武  文章来源:本站原创  点击数37623  更新时间:2018/4/10 9:11:15  文章录入:张东波  责任编辑:张东波


 

 

新农业龙头采集行业数据实施特征标签工程

 

新农业龙头的核心能力看家本领(1

 

大数据是现代农业体系的关键要素,是新农业龙头的核心能力,由于农业大数据需要定向采集积累储备,具有不可替代性,是新农业龙头的战略性资产。新农业龙头通过实施数据特征标签工程,能够成为行业数据的主人,成为行业数据知识资产的拥有者,成为线上线下两栖品牌的提供者。新农业龙头要以数据特征标签为抓手,掌握数字经济时代生存发展的看家本领,在新农业数字空间跑马圈地,找到自己立足的山头领地。

 

1、定向采集全产业链多维度大数据

 

店场网是新农业龙头,要带领全行业进行数字化转型,只有实现了数字化转型之后,才能实现与云计算人工智能的对接,才能够实现智能化操作运营。实现向数字农业转型,首先要解决“数据荒”的问题,补上行业数据短缺这块短板,先解决行业数据“有没有”的问题,再解决够用不够用的问题,同步解决数据质量“好不好”的问题,保证收集的是有用的好数据,不是没用的垃圾多余数据。

 

店场网为小农户提供生产性云服务,是为了收集农牧场食材生产端大数据,店场网为餐饮店赋能发展会员体系,是为了收集销售端大数据。店场网平台通过专家做客服收集交互大数据,通过提供线上销售渠道收集交易大数据,通过搭建B2B交易渠道收集商家交易数据,通过构建餐饮会员体系收集C端消费大数据。通过物联网传感器收集生产现场大数据,应用智能机器人客服收集销售现场大数据等等。

 

细分行业大数据是新农业龙头的核心能力,店场网通过全产业链大数据全方位布局,形成了产销供需商业闭环,店场网拥有了全行业产业链各环节大数据,积累了本行业产品全生命周期大数据,收集积累视频图片语音文本全维度大数据。就掌握了数字农业的主动权,水到渠成地实现与云计算人工智能对接,实现数据驱动发展运营。

 

2、实施特征标签工程为机器学习铺路

 

人工智能是计算机智能,机器智能是通过机器学习来实现的,机器学习的主渠道是监督学习,而监督学习则高度依赖特征标签数据。数据集的大小多少质量优劣严重影响机器学习的效果好坏。当前,数字农业实现智能化最大制约因素是缺乏数据,最大的难题是为行业数据提供特征标签问题,行业大数据在没有标签之前,还无法对接应用人工智能。不解决标签化数据瓶颈制约问题,机器学习就是一句空话。

 

数据标签需要采取工程化方式来解决,包括定向采集行业数据,还包括在行业数据中抽取特征和加注标签,采取人工标注或者机器自动化标注。店场网特征工程重点是对产品抽取特征,利用特征设计标识词,诸如,饲养动物特征词,种植作物特征词, 原料食材特征词,餐桌菜品特征词等等。将特征词注册成为商标, 将商标设计成商标应用词,利用商标应用词作为数据标签。这些特征词是对接语音助手的“唤醒词”,对C端消费者是呼之即来的“直达号”,对B端商家是直接调用的AI工具。

 

3、以文本数据为核心优化数据库结构

 

在产业互联网平台上,解决信息孤岛问题是通过节点智能连接实现的,实现柔性化制造个性化生产是通过对生产要素智能连接调度实现的。农业互联网平台主要功能是智能连接,包括对种养加各环节进行智能连接,在产供销之间进行智能连接等等,通过智能连接调度实现产销供需一体化运营。数据特征标签工程是为智能连接服务的,特征标签数据库就是农业互联网平台必备的工具箱。

 

店场网平台为构建农业互联网标识解析体系,组织实施数据特征标签工程,利用汉字中的字和词做标识,利用特征词做数据标识。为什么选择汉字词作数据标签?原因是AI智能狗是识字的,知道每个字词是什么意思。这样,汉语字典及词典就成为现成的知识库,还是行业特征词的知识图谱数据集,可以借用字典词典解释不同特征词之间的各种关系,帮助机器理解特征词相关句子之间的上下文关系。

 

大数据有文本、语音、图片、视频四种基本形式,四大数据之间的关系不是一字并肩王,其中文本数据是核心数据,文本数据是行业知识图谱,为行业大数据提供体系架构支撑。文本数据是底层结构基础设施,可以利用带标签的文本数据集为视频添加字幕,给图片添加水印,实现图文并茂的效果。有了文本数据可以转换成语音,在将语音转换成文本时,为了准确理解语音含义,可以利用文本数据进行上下文对照。

 

4、特征标签如同高速公路的标识牌

 

店场网根据地域品种等特征构建了产业体系数据集,对生产端的“农牧场”进行了定义分类;对销售端的“餐饮店”进行了定义分类;对饲养动物(猪牛羊鸡鸭鹅)进行了定义分类;对米面粮肉蛋奶食材进行了定义分类,对多种餐桌菜品进行了定义分类,这样就构建形成了体系化数据集。体系化数据集反映了数据之间的各种关系,反应了产业链内部节点之间的关系,产业生态圈内各个链条之间的逻辑关系等等。

 

在设计体系化数据集的时候,就已经对这些数据进行了分类和分层处理,就构建了体系框架结构,对各个节点特征词都加注了标签进行标记,应用标签标注了类别,应用标签标识了层次,标签反应了关键词的特征,体系化标签定义了标签之间的结构关系,为机器深度学习提供了极大的方便,可以加快对接AI工程进度,使人工智能能够尽快开花结果。

 

未来语音交互将成为人机交互的主要方式,语音助手是AI最重要的应用场景,语义解析是机器学习最大的难题。店场网构建了行业文本特征标签数据库,可以对原生数据流自动化加注标签,使文本中位于节点的句子都有行业标签进行定义。这样就可以与通用语音助手顺利对接融合。

 

通用语音助手通过字典词典可以知道句子里面字和词是什么意思,通过店场网知识图谱知道里面的特征词是什么意思。那些通用字词典知识库相当于高速公路的路面和护栏等基础设施。店场网行业标签如同高速公路的路标和路牌。能够消除店场网行业数据语义理解的歧义性,降低语义模糊性,提高对话答案的精准性,能够帮助店场网行业语音助手加快打造进度。

 

 

打印本文 打印本文  关闭窗口 关闭窗口