楚小云 / 小云问答 / 问答详情

不丢弃音频中英文文本间需要怎么处理

2023-06-30 10:13:10
肖振

们平时使用的微信qq都有具备聊天语音转成文字的;外部的音频文件转文字的话就需要借助一些专门的软件来实现喽,比如身边人用的比较多的浮云识音。

基本原理:语种识别,根据一段音频判断该音频是英语、中语还是法语,即判断音频的语种。语种识别项目的整体思想就是把语音数据转换成相应的语谱图或者MFCC特征,再对特征进行分析,从而判断出该语音数据的语种类别。

公开数据集:Topcoder竞赛数据(44.1khz的mp3录音,每条10秒,176种语言合计66176(176*376)条数据,诸多小语种)。东方多语种语音识别竞赛数据(海天瑞声提供7种东方语种数据+8种外语语种数据,列明的包括粤语/国语/印尼语/日语/俄语/韩语,清华大学提供越南语/哈萨克语/藏语/维吾尔语)

基本音频处理流程:语音输入,然后音频信号特征提取,然后进行特征分析处理,最终得到结果,其中音频特征提取多半采用频谱图或者MFCC特征。

语音输入:wav(波形音频文件)mp3文件或是麦克风中输入的音频信号输入音频。

音频信号特证提取:语音信号处理的目的是弄清语音中各个频率成分的分布。常用的数学工具是傅里叶变换,而傅里叶变换要求输入信号是平稳的,需要对语音信号进行分帧处理,截取出来的一小段信号(通常20-30ms)就叫一帧。【微观里断定输入信号是平稳的】语音分帧→每一帧分别FFT(离散傅立叶变换)→求取FFT之后的幅度/能量,这些数值都是正值,类似图像的像素点,显示出来就是语谱图。其中语谱图的x是时间,y轴是频率。利用语谱图可以查看指定频率端的能量分布。MFCC是最常用的声学特征参数。原理将音频转化为梅尔频率,然后进行倒谱分析。

相关推荐

海天瑞声是国企吗

不是国企。是一家与国有资本有关的中国企业,但并不是严格意义上的国有企业。海天瑞声成立于1993年,从2001年起开始进行改革重组,把龙华电子电容公司,广东鸿远通信设备公司,中山市北部电子科技公司的产业固定资产和技术人员整合组建而成,为独立的民营高新技术企业,尽管海天瑞声在成立和改革重组时受到了国有资本的支持,但它在1997年股份制改革时曾经接受国有企业广州电子集团的控股,随后在2004年,2008年,2010年进行了三轮股权转让,海天瑞声股份有限公司的股东包括自然人,法人,投资基金等各种实体,不再与国有资本有直接的关联。随着改革开放的不断深入,中国政府逐渐放宽了对外商投资和私营企业的限制,同时也优化了国有企业的管理和盈利模式,在这种背景下,中国经济中涌现出了许多民营企业和混合所有制企业,成为中国经济规模和活力的重要来源。
2023-06-29 20:51:251

北京海天瑞声科技股份有限公司电话是多少?

北京海天瑞声科技股份有限公司联系方式:公司电话010-62660053,公司邮箱ad@speechocean.com,该公司在爱企查共有6条联系方式,其中有电话号码1条。公司介绍:北京海天瑞声科技股份有限公司是2005-05-11在北京市海淀区成立的责任有限公司,注册地址位于北京市海淀区成府路28号4-801。北京海天瑞声科技股份有限公司法定代表人贺琳,注册资本4,280万(元),目前处于开业状态。通过爱企查查看北京海天瑞声科技股份有限公司更多经营信息和资讯。
2023-06-29 20:51:331

北京海天瑞声靠谱么

北京海天瑞声靠谱。根据查询相关公开信息显示,北京海天瑞声拥有正规营业执照,截止到2023年1月9日依照营业执照正常运营,无违法犯罪记录,是非常靠谱的。北京海天瑞声科技有限公司(speechocean)是一家全球领先的多语言、跨领域的人工智能数据及相关数据服务的提供商。
2023-06-29 20:51:421

有关数据安全方面的考虑,海天瑞声如何保障?

公司历来高度重视数据安全及合规体系建设,确保境内、境外业务的开展均以安全和合规为重要前提。公司也将放眼全球,将海外拓展作为公司未来重要的业务发展方向,目前公司已从技术跟踪、品牌升级、体系搭建、营销推广等多维度助力全球化市场扩张,力争在海外市场形成新的业绩突破。同时,公司也将紧密关注国际形势变化,尽力确保自身业务平稳发展。
2023-06-29 20:51:491

北京海天瑞声算大厂吗

算。原因如下:1、北京海天瑞声占地面积10万平方米。2、有一栋3层楼的生产加工楼,有独立的员工宿舍、食堂。3、员工人数一万人以上。4、工作稳定、制度完善,能按时发工资。有一个完整规范的体系。
2023-06-29 20:52:001

海天瑞声值得去吗

值得去。北京海天瑞声科技有限公司,已经是上市公司了,又有技术作为基础,人工智能服务是现在非常热门的行业了,未来发展前景还是不错的,所以还是值得去尝试的。北京海天瑞声科技股份有限公司,创立于2005年,法定代表人贺琳,公司经营范围包括:技术开发、技术服务、技术咨询、出租办公用房等。
2023-06-29 20:52:071

海天瑞声是龙头企业吗

海天瑞声是龙头企业。海天瑞声是中国AI基础数据服务行业的头部企业,市场份额位居行业前五,以海天瑞声、百度众包为代表的AI基础数据服务行业前五大企业的市场份额为26.2%。
2023-06-29 20:52:151

国内大多数语音识别技术商都在什么地方

国内大多数语音识别技术商都在安徽合肥、北京、杭州。当前,国内语音识别公司主要包括:科大讯飞、歌尔股份、全志科技、汉威科技、共达电声、盛视科技、海天瑞声和精伦电子。1、科大讯飞科大讯飞是语音识别技术的龙头企业,研发完成在深度学习新框架下的语音识别技术,识别准确率保持业界领先。针对采访、会议、节目、授课等复杂场景下的语音转写效果持续提升,业界唯一达到实用门槛;研发完成通过较小代价提升方言和小语种识别可用性的技术路径,方言和维语、藏语识别效果大幅提升。结合麦克风阵列的远场识别、语音唤醒等关键指标相对提升达到50%以上,有效支撑万物互联下的远场人机语音交互的进一步普及。2、歌尔股份歌尔股份公司所处的行业为电声行业,主营业务为微型电声元器件和消费类电声产品的研发、制造和销售。3.全志科技全志科技公司非常重视AI技术在终端场景的应用落地,现有多个产品线都可以支持包括智能语音、智能视觉等AI相关应用,未来将根据客户需求持续推出芯片产品和解决方案。4.汉威科技汉威科技公司表示传感器的应用范围非常广泛,在感知和数据采集环节发挥重要作用,可穿戴设备将是其重要应用方向。5.共达电声共达电声公司是专业的电声元器件及电声组件制造商和服务商、电声技术解决方案提供商。公司是专业的电声元器件及电声组件制造商、服务商和电声技术整体解决方案提供商,是国家级高新技术企业、中国电子元件百强企业。6.盛视科技盛视科技公司在声音方面的自主研发技术包含语音采集、语音端点检测、语义分析、人机交互和声波检测与分析等。公司产品海关多功能机器人利用语音识别、自然语音处理技术等服务。7.海天瑞声海天瑞声公司拥有基于DNN-HMM等模型的多语言语音识别技术,并掌握当前语音识别中流行的多种深度学习技术。在语音识别算法领域,公司已掌握细分技术语音数据库质量预估技术,已取得4项发明专利授权。8.精伦电子精伦电子公司的四大主营业务包含电子通信产品、身份证阅读机具、控制类产品、云影音智能机系列产品及解决方案为四大主营业务。
2023-06-29 20:52:231

生成式AI的主要应用场景有哪些?

生成式AI主要应用于自然语言处理领域,包括文本摘要、语言翻译、对话系统等场景。这些应用场景需要用到大量的语料数据和对应的标注数据,以提高生成模型的准确性和泛化能力。海天瑞声作为国内知名的数据提供商可以提供大量的安全合规的训练数据。
2023-06-29 20:52:491

建服务全球的中国人工智能开源创新平台

以“智聚未来 共筑AI生态”为主题的中关村论坛人工智能开放生态建设论坛在北京举行,来自企业负责人、行业专家等各界代表共150余人参会。论坛由科学技术部高新司,北京市科学技术委员会、中关村科技园区管理委员会,中关村科学城管理委员会指导,中关村视听产业技术创新联盟、新一代人工智能产业技术创新战略联盟和北京智源人工智能研究院共同主办。与会嘉宾就人工智能开放生态建设的重要性、现状、发展趋势以及取得的重要进展开展交流和研讨。人工智能已成为引领未来发展方向的核心驱动力,对各个行业的渗透性、扩散性和颠覆性与日俱增,以预训练大模型、AI和算力为代表的新兴技术正在引发新一轮AI创新热潮。人工智能通用模型平台化显著降低了人工智能技术赋能千行百业的准入门槛。作为当前大模型商业化落地最成熟的应用,AIGC(利用AI生成内容)已成为数字经济新的引爆点。近日,北京市正式发布《北京市促进通用人工智能创新发展的若干措施》,此外,上海、深圳、成都等地区也都陆续采取行动,抢占发展的“窗口期”。生成式AI引发的“千模大战”已经打响。论坛上,华为升腾计算业务CTO周斌认为,目前无论是互联网还是金融、安评、制造等领域,都在探索如何用新一代人工智能加速整个体系的提质增效。而人工智能转化成为生产生活中提质增效的工具体系,就必然要应用到场景中去。旷视科技合伙人兼总裁付英波表示,在技术上,落地实用是衡量算法价值的唯一标准。在产品上,软硬一体是AI落地的必经之路。在大模型和AI大爆炸大发展的时代,AI和实体经济、实体产业的结合,一定会让物理世界变得更加美好。HTC全球副总裁黄昭颖则认为,元宇宙是网络发展进程的下一个阶段,下一世代的互联网,跟每个人、每个企业都息息相关。北京海致科技集团有限公司的CEO杨再飞也认为,大模型确实改变了一切,有非常多的机会,在应用领域希望能够去寻找到更多的场景,充分发挥知识图谱的优势,来更好地探索出大模型。我国人工智能快速发展,已初步形成了应用导向、场景驱动、技术支撑的人工智能发展生态。营造良好的人工智能发展生态,可以为实体经济、数字经济的发展注入强劲动力,提供坚实支撑。但与此同时,与会嘉宾认为,目前我国在底层算法、关键软硬件和生态体系等方面与国际先进水平还存在着较大差距,这些问题需要共同破解。北京海天瑞声科技股份有限公司CEO王晓东表示,大模型的发展对人工智能发展具有重要意义,但同时在算力、算法和数据等方面也面临着诸多挑战。周斌也认为,大模型消耗非常多的算力,这些算力通常都会存在于一个大规模的分布式系统里面,如何在这样一个分布式系统里面去解决问题,是技术领域面临的挑战。针对面临的问题和挑战,中科院院士、CCF开源发展委员会主任王怀民教授表示,要建立人工智能开源创新的新平台,有效支持国家AI芯片发展及智算中心的发展。要提高在人工智能开源领域的影响力,就要构建起一个服务全球的中国人工智能开源创新平台,培育出有全球影响力的源自中国的开源项目,包括人工智能项目,这样才能提升我们在这个领域的影响力、竞争力。
2023-06-29 20:53:081

DOTS-AD自动驾驶标注平 台是否支持协同标注,可以同时支持多少人使用?

海天瑞声DOTS-AD自动驾驶标注平台支持协同标注,并且可以支持万人同时作业,能够解决项目经理和标注员的使用痛点,提升标注效能,且支持多元化的部署方式。
2023-06-29 20:53:471

北京海天瑞声科技股份有限公司怎么样?

简介:北京海天瑞声科技有限公司(speechocean)是一家多语言、跨领域的人工智能数据及相关数据服务的提供商。“海天瑞声”也是全球最大的工程化人工智能数据资源供应商之一。截止2014年年底,“海天瑞声”旗下运营的“天籁数据中心”已经拥有近500个可授权使用的大型工程化数据库,涵盖了110多种语言、覆盖全球70多个国家和地区。其中包括语音数据资源、文本数据资源、图形图像数据资源和视频数据资源,这些数据库都拥有独立的知识产权,并具有不同层级的转写和标注,其数据规模和品质可以完全满足客户在人机交互技术领域的产品开法定代表人:贺琳成立时间:2005-05-11注册资本:3000万人民币工商注册号:110108008323814企业类型:其他股份有限公司(非上市)公司地址:北京市海淀区成府路28号4-801
2023-06-29 20:53:551

2023数博会投资人大会在贵阳举行

中国国际大数据产业博览会投资人大会暨数字经济投融资联盟数谷行活动在贵阳举行。大会以“引金聚黔、数智赋能”为主题,邀请优秀行业投资人、知名专家和大数据企业负责人,就未来产业投资方向、大数据产业面临机遇和挑战等话题展开探讨。中国数字经济迅猛发展。数据产业规模达1.57万亿元,同比增长18%;数字经济规模首次突破50万亿元,总量稳居世界第二。政府工作报告提出,大力发展数字经济,加快传统产业和中小企业数字化转型,着力提升高端化、智能化、绿色化水平。中国互联网投资基金管理有限公司党委书记、董事长在发言时表示,数字化、智能化、绿色化的融合发展,成为未来经济社会发展的重要方向,为投资和发展找到新的空间。我国数字经济整体渗透率还不高,对结构转型提出新的要求,因此要更加重视数据创新的驱动因素。算力基础设施建设、生产系统融合发展等也同样带来发展机遇。中网投聚焦智能化领域投资,面向硬核科技,解决卡脖子的短板问题和环节,支持智能算法平台类的创新,深度布局在AI视觉、语音、自然语音处理的通用算法框架。关注大模型、无监督的学习理论突破和基础创新。关注算力数据基础设施布局,重点投资新型计算的AI芯片,以及专用计算和通用计算领域优质的成长型企业等,通过上述投资举措,深耕数字经济,目前已经形成了初步的产业布局。 作为数字经济的重要基础设施随着ChatGPT等产品的面市,带动了人工智能行业的火热,也推动了人工智能大模型的快速发展。这也为大数据产业健康发展带来了更多的挑战。北京海天瑞声科技股份有限公司董事长表示,产业内各个大模型逐渐呈现规模扩大化发展趋势,参数的规模基本上都达到了千亿级。甚至有一些模型的参数已经逼近万亿的水平。 目前无论是数据库的设计采集还是标注,各个环节难度都在显著提升,这为数据服务企业带来了更多的挑战。大模型对数据精度的要求越来越高,覆盖的场景越来越丰富,对数据的需求量也越来越大。与此同时,对数据的需求越来越复杂,要求的标准也越来越高。但机遇与挑战并存。她认为,数据安全是行业可持续发展的重要的保障。近年来,国家高度重视数据安全发展,相继出台数据安全法、个人信息保护法等法律法规。政策与法律环境与整个产业的发展加速对齐,为产业界树立了更好的发展目标。随着数据服务产业正在快速走向正轨,也为符合政策法规的企业创造了更好的发展机会。“大数据产业刚刚开始,目前人类正处于从数字化到智能化转型的起步阶段,很多基础设施还需要进一步完善。而法治是经济发展最核心、最基本的保障,如果没有法治,一切都无从谈起。”厚望创新成长基金管理合伙人表示说。
2023-06-29 20:54:021

海天瑞声语音标注的WER是什么意思

在语音识别中,常用的评估标准为词错误率WER。为了使识别出来的词序列和标准的词序列之间保持一致,需要进行替换,删除,或者插入某些词,这些插入,替换,删除的词的总个数,除以标准的词序列中词的个数的百分比,即为WER。在语音识别中,除了WER,还有句子识别错误率这个标准,即SER,SER表述为句子中如果有一个词识别错误,那么这个句子被认为识别错误,句子识别错误的的个数,除以总的句子个数即为SER。
2023-06-29 20:54:401

人工智能的技术架构包括

(1)基础层。基础层一般由软硬件设施以及数据服务组成。软件设施主要包括智能云平台和大数据平台,比如国外的谷歌大数据平台和国内的百度智能云平台等;硬件设施主要包括CPU硬件及芯片,美国的高通和苹果都是这个领域的代表企业;数据服务包括通用数据和行业数据,由于大部分已经积累海量数据的互联网企业不会对外分享数据资源,故市场上出现了很多第三方数据提供企业,典型代表就是国内海天瑞声技术公司以及国外的CrowdFlower数据服务公司。目前,我国在基础层这个层面还比较薄弱。(2)技术层。技术层由基础框架、算法模型以及通用技术组成。基础框架主要指分布式存储和分布式计算,同时也是大数据技术的基础;算法模型分为机器学习、深度学习以及强化学习,其中机器学习是实现人工智能的一种重要手段,例如生活中常用到的iPhone手机的Siri助手以及高速公路收费站点的ETC车牌识别系统都是运用了机器学习的算法,深度学习和强化学习则是机器学习的技术之一,最典型的运用代表就是谷歌公司开发的阿尔法围棋机器人(AlphaGO);通用技术有自然语言处理、智能语言、计算机视觉等,我国现在在这个领域已经达到了世界上中上水平,代表企业有科大讯飞和依图网络科技等。(3)应用层。应用层主要包括应用平台和智能产品,应用平台主要是各种智能操作系统,如美国的IOS系统和安卓系统,以及国内的华为鸿蒙系统等;智能产品包括像人脸识别、智能客服、无人驾驶等运用了人工智能技术的设施设备。近来十几年,我国在这个层面的发展呈爆发式的趋势,涉及的领域有零售产业、金融产业、电商服务、安保工作、教育产业等。人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。人工智能可以对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。
2023-06-29 20:54:481

如何使用数据驱动的方法对自然语言处理NLP模型进行改进和优化?

使用数据驱动的方法对自然语言处理NLP模型进行改进和优化的一般步骤如下:确定优化目标:明确优化目标,例如提高准确率、提升处理速度等。收集和准备数据集:选择适当的数据集来测试和验证模型性能。选择合适的评价指标:根据优化目标,选择适合的评价指标,如精确率、召回率、F1值、ROC曲线等。分析和评估模型性能:利用收集到的数据集对模型进行评估和测试,比较不同模型的性能表现,并找出可能存在的缺陷或瓶颈。提出改进策略:根据模型性能评估结果,提出具体的改进策略,例如改进特征提取算法、调整超参数等。实施改进措施:根据提出的改进策略,修改原有的NLP模型或者构建新的模型来进行实验验证。重新评估和验证改进后的模型:重复上述流程,不断优化改进NLP模型,直到达到满意的性能表现为止。结果解释和总结:将优化过程中的关键步骤、方法和结果进行归纳和总结,以便于未来相似任务的参考。
2023-06-29 20:54:552

黄龙视频安全吗

弹通过查询相关资料显示,黄龙视频不安全。在2022年第三季度,商丘市互联网违法和不良信息举报中心深入开展暑期未成年人网络环境整治、打击整治养老诈骗等专项行动中是经查,“黄龙视频”“海天瑞声”等46家网站,因落实主体责任不到位,导致被不法分子篡改并发布游戏赌博、低俗色情、电信诈骗等违法违规信息,商丘市网信办指导各县区网信办对上述网站负责人依法实施约谈,责令注销ICP备案。
2023-06-29 20:55:021

有人知道“海天瑞声”的语音数据质量怎么样吗?

海天瑞声数据质量的口碑是很好的。但不知你需要什么样的数据?海天瑞声的中文普通话库、方言语音识别库、小语种语音识别库(如西班牙语识别库、阿拉伯语识别库),录制的质量非常好,我们实验室用过。
2023-06-29 20:55:101

必读:这家基金公司4年换6位高管,仅发行1只公募产品还险遭清盘

市场行情 创业板指跌近1%,大消费板块集体走强 1、A股三大指数今日集体调整,沪指全天弱势震荡,创业板指盘中跌超1%。 2、旅游、食品、乳业等大消费板块走强,宝立食品、新乳业涨停,同庆楼、金陵饭店、黑芝麻等纷纷大涨。 3、数字水印技术受关注,概念股集体走强,汉邦高科、汉仪股份、合兴包装、金运激光等多股涨停或涨超10%。 4、ChatGPT、AIGC等人工智能板块总体呈现冲高回落走势,鸿博股份4连板,佳创视讯、格灵深瞳涨超10%,慧博云通、汉王科技、海天瑞声等则明显走低。 5、此外光伏、固态电池等板块走弱,欧晶科技跌停,珈伟新能跌超10%。 6、个股跌多涨少,两市今日成交8929亿元。截止收盘沪指跌0.3%,深成指跌0.59%,创业板指跌0.96%。 7、以每日额度余额口径,北向资金截至A股收盘净流出14亿元;以买卖成交额口径,北向资金净卖出34亿元。 8、行业ETF多数下跌,新能源车ETF跌近2%,有色金属、人工智能、碳中和ETF跌超1%;房地产ETF涨幅居前。 (华尔街见闻) 恒生指数收盘跌2.01%,恒生科技指数跌4.58% 汽车股、科技股跌幅居前,小鹏汽车跌约8%,理想汽车跌约8%,哔哩哔哩跌约8%,百度集团跌约7%。 (华尔街见闻) 行业动态 新基金快速建仓 成长风格更受青睐 今年以来A股市场表现较为强势,多只成立不久的新基金明显加快了加仓节奏。新增量资金也正在涌入,多只新基金宣布提前结束募集。从资金流向来看,成长风格颇受青睐,更有大量投资者借助ETF加码相关板块。 (上海证券报) 蚂蚁财富展示基金赎回费提醒交易磨损:预估每月可“劝退”用户800万元手续费 近日,记者发现,投资者在蚂蚁财富平台卖出基金时,可以清晰看到基金不同持有时长对应的差异化手续费。按照基金公司的赎回费率规则,一般持有时间越短,手续费越高。据了解,这是蚂蚁财富继提示A类、C类基金的费用差异后,又一费率透明化的动作。 据蚂蚁基金产品负责人章雅静介绍,这个功能已于去年上线,初期主要针对股票型基金,后续基本扩展至全量开放式基金。功能虽小,背后是复杂的智能数据处理能力。章雅静表示,这一功能希望让用户直观了解交易成本,充分保障投资者利益。根据实验组对照数据测算,费用预估展示一定程度降低了部分用户的短线频繁操作,以此推算,该功能预估平均每月可以“劝退”用户超800万元的手续费。 (市场资讯) 医药板块有望持续回暖 在经过一段时间的上涨后,医药板块出现回调,但作为2022年四季度基金重点加仓的对象,医药板块目前仍然被多家机构和多位基金经理看好。机构人士认为,医药板块估值、机构配置、交易拥挤度位于低位,是值得中长期关注的方向。其中的创新药、中药等细分领域值得重点关注。 (中证报) 定位更清晰多层次资本市场赋能转型升级 在全面实行股票发行注册制后,多层次资本市场板块架构更加清晰,特色更加鲜明,在助力不同行业、不同类型、不同成长阶段企业成长的同时,各板块将通过IPO、转板、分拆上市、并购重组等方式加强有机联系。 (中证报) 新基民好帮手音频平台陪伴式投教风行 近年来,随着喜马拉雅、蜻蜓FM、懒人听书等音频平台受到越来越多用户的喜爱,这些音频平台诞生出了一系列优质的基金投教课程。与不少基金公司在官方账号推出的投教课程不同,这些音频平台上的投教课程通俗易懂,难度由浅入深,很少推荐特定基金产品,且课程周期较长,给听众带来了长期陪伴式的投教体验。 (中证报) 证监会同意“基金E账户”APP公开试运行 近日,证监会同意中国结算启动公募基金账户份额信息统一查询平台暨“基金E账户”公开试运行。“基金E账户”APP已在各大手机应用商店上架,试运行期间投资者可通过持有基金的基金管理人获取邀请码进行注册使用。 (证监会网站) 公司动态 难!这家基金公司4年换6位高管,仅发行1只公募产品还险遭清盘 2月10日,明亚基金公告称,法定代表人变更为丁玥。而在上个月,明亚基金的总经理也刚换成丁玥。每经记者注意到,从2019年2月11日明亚基金正式获批至今,刚好要满4年。4年里,明亚基金换了3位总经理,3位督察长。在产品方面,该公司仅发行了1只公募产品,产品更换了3任基金经理,还差点清盘。
2023-06-29 20:55:171

帮百度AI干脏活累活的公司,都死了

文 | 李夜 在接触数据采标行业过程中,黑智听到一个陆奇和河南标注工厂的故事。 据悉,大部分河南标注工厂用的是百度的标注工具,干的是百度的活。陆奇掌旗百度时,放出了大量采标需求。当时,活不难(准确率只有90%),标注的利润空间可以达到60%—70%。有些企业盲目扩张,一下子招了几百人;陆奇离开后,百度需求恰也减少。2018年下半年,准确率又普遍提高至95%-96%,活难干了。这些工厂只会百度的标注工具,很难接别家的业务,因此死了一批。没有死的工厂不得不裁员,目前处于艰难转型中。 当河南标注工厂艰难转型时,张三的标注公司却正式营业。公司初建,百事繁杂,前几天,黑智才在中午空闲时间,联系上他。他告诉黑智,两个年前的单子需要返工,一直在忙。对于初建公司,忙比闲好。如果有一天空闲下来,张三说他晚上都会睡不着觉,“一天没活干,几千块钱就打水漂了。一个月得支出15万(注:目前,公司有65名员工)。” 在他看来,标注行业是一个苦行业,“前半年,一定会赔钱的,你要做好一个人赔一万块钱的准备。”他笑着告诉黑智,“如果你和谁有仇,就劝他干标注吧。”这是标注圈有名的段子。标注圈说大不大,说小也不小,分了四个梯队。张三说,他的公司属于第三梯队。第一梯队,比如百度众测、京东众智等。第二梯队,比如龙猫数据、Testin云测、倍赛 BasicFinder、数据堂等。他将第二梯队和第三梯队的关系,比做小房地产开放商和搬砖工人。第三梯队之下,是数量巨大的小作坊,团队规模在3-5人之间。 标注行业又是一个有前景的新生行业。 新生意味着不确定与无限可能,“干标注就像将水倒进一个水桶里,每拉一个框就是添一碗水。目前,谁也不知道还能添多久,只有水溢出来时,才知道。”这并不妨碍张三设计未来,“第一步,现阶段先服务好第二梯队,以后搞一个平台,把公司做成第二梯队。” 300亿市场与转折点 数据采集、标注市场有多大?300亿元。 1984年前后,这个市场就出现了。欣博友的公司是众多公司中的一家。当时,这些公司更像一个“录入公司”——将纸质内容电子化,而不是标注公司。“录入”是一个劳动密集型的工作,一家公司需要雇佣很多人来做这件事。智联招聘显示,欣博友在公司人数项上,勾选的是“1000—9999”。 和欣博友不同,海天瑞声成立于1998年,做的是语音标注,自建了很多语音库,业内人士告诉i黑马&黑智,重复销售以前做的语音库是海天瑞声比较大一块业务。数据堂成立于2011年,通常外界对其最深印象是“它是国内最大的数据交易平台”。这和其起家业务相关。 2015年前后,随着以榜单中的人工智能公司TOP50的强势崛起,数据标注和采集需求逐渐多了起来。这个市场才真正意义上形成,也即前面提到的四个梯队。他们作为乙方,进入到这个日益扩大的市场,为估值超10亿美金的AI独角兽服务,教能够改变世界的人工智能产品学习。 1.得数据者得AI的天下 数据是AI公司的必需品。就像人每天需要一日三餐,而AI模型也每天需要数据的喂养。数据和AI模型的关系,倍赛 BasicFinder创始人兼CEO杜霖理解深刻。高中期间,他开始研究计算机视觉,高三发表了论文。大学期间,他也一直在做相关的研究。他知道数据对于AI模型的重要性,并得出“AI建模没有门槛,数据才是门槛”的结论。 在他看来,现阶段的人工智能是简单的认知智能。“认知智能就是帮你去识别、分类这个世界。分类器的构造是个数学问题,就是由数据堆起来的。”“深度学习本质上是个数学问题,是由大量的样本空间数据反向构造分类器的系数空间的过程。你要有很多样本,什么叫样本?知道正确答案的才叫样本。这跟我们小时候求多样式、求系数式是一个道理。我们要有很多空间中的已知点,才能拟合成一个多样式。同理,深度学习也是这个模式,也需要大量样本,也即标定好的数据。” 于是,杜霖认准了“在现阶段工业界的AI应用研发,标数据是一定跳不过去的,可能10年之内都要依赖于标数据。”数据对于AI的重要性如斯,但数据的标注和采集公司并没有学界、业界、资本甚至是媒体的认可,光环一开始便属于那些做模型研发的AI公司,比如商汤 科技 、旷视 科技 等。 “一个公司做成了很好的人工智能产品,大家都会说人工智能算法牛或者科学家牛,但从没见人说数据收集得好的。”Testin云测VP贾宇航说。贾宇航告诉i黑马&黑智,不但镁光灯照不到,数据采标还是个“苦活”。苦到没有人想去做。它很像移动互联网,产品好,没人想到军功章有APP测试者一份。一旦出了问题,第一个被责备的一定是做测试的部门。 2.300亿元数据采标市场 数据对于AI公司的重要性不言而喻。据悉,AI公司投入10%—15%的经费用于数据采标。也有人提到,这一比例为20%—30%。2018年,中国AI公司的总融资规模达到千亿元以上,数据采标的市场约为100亿元—300亿元。其中,有三分之一是AI公司内部的标注部门之间消化的,有一些会被商务流程外包公司瓜分,剩下的25%—33%流向专门做数据采标的第三方公司。目前,AI融资规模约以每年25%的速度在增长。 随着AI技术门槛的降低,越来越多的公司开源了自己的框架,把数据喂进去就能出来一个模型。越来越多的头部垂直公司开始建立AI部门,之前它们多会把业务交给做AI模型的公司来做,这两年,龙猫数据、Testin云测、倍赛 BasicFinder的很多客户不是来自AI行业的客户,而是传统公司的AI业务部门。龙猫数据创始人兼CEO昝智认为从这个角度来看,市场规模并不好算,BAT、小米、京东、TMD等互联网公司和传统行业里的传统企业,它们会拿出多少预算做AI,不得而知。唯一可以肯定的是,这两三年,数据采标的市场规模越来越大。 这两三年,AI模型对数据采标的复杂度和精细度要求也越来越高了。比如说,现在,做一个人脸拉框,人脸的拉框精度要求在五像素以内或者三像素以内;又或是,整批数据精确度需在97%或者99%以上。贾宇航认为,精度的提高是AI行业发展的必然结果。对于AI行业,有一句话叫 Garbage in, Garbage out,低精度的标注数据对于算法没有任何意义。只有能持续输出高精度采标数据,才是一个能持续保持竞争优势的服务商。 第二,更庞大、更多样的数据规模。庞大在于数据量会更大,以传感器为例,随着传感器成本下降,并被大量应用,将有更多大量的数据需要被标记;更多样指的是更丰富的数据维度,在今年的CES展上,松下推出的智能家居解决方案,不仅仅通过电视上的摄像头观测人脸的疲劳度,还通过椅子上的电容传感器,去检测人的心跳。而之前,疲劳检测只是通过摄像头捕捉人脸。将来,更多维度的数据将被收集,不单单是2D的图象、声音,3D的激光雷达以及心跳数据等也将被纳入到采标的范围内。 3.转折点 需求侧的变化,不可避免地在供给侧引起不小的地震。供给侧开始从密集劳动型行业向新产业、新模式——工具+众包转型。洗牌开始了,数据采标迎来了下半场。 受负面影响最大的第四梯队。无论是采标的复杂还是要求愈高的精度,对于它们来说都不是好消息。去年中旬以来,每天十几、二十几家小作坊要求挂靠在倍赛 BasicFinder旗下,这说明小作坊已经失去业务的来源。“他们靠低质量数据和低价抢市场的模式,已经不能持续了。因为AI工程师不能接受低质量的数据,也不能接受不靠谱的交期。”杜霖说。 张三认为,第四梯队坏了规矩。他们先靠低价四处抢单子,而后内测什么样的项目能够在单位时间内产出最多,再去做这个项目。其它项目,则被分包给更小的团队去做。质量难以保证。“他们不算房租、管理等,只核算人工费用。他们的逻辑是一个人一天50块钱,高于这个价就是赚的。于是他们就报100元的单价。而第三梯队需要承担房租,税收、管理费用以及每天的喝水吃饭等乱七八糟的消耗,至少报200元的单价,才可以做。” 早期,第四梯队靠着这种方式,赚了一些钱,回收了硬件成本,并有结余。但2018年初,第二梯队开始做店测,“看看你有多少人,看看你的场地。你不专业,行业正在慢慢把你淘汰掉。”淘汰,意味着没有业务来源,那么多人需要吃饭、拿工资,不专业的第四梯队危机便出现了。即便能够找到项目,采标项目的要求提高,比如准确度要达到95%甚至是99%以上,小作坊必须从团队中抽出一部分人脱产质检和最后的抽检,成本也会上升。 压力,对于行业中的每一个参与者都是同样的。对于龙猫数据、Testin云测、倍赛 BasicFinder等第二梯队公司来说,他们需要创业迭代,他们需要想清楚在这个过程中如何突破自我,不断创新,走出自己的舒适区。他们找到了一个抓手起步,需要思考的是未来怎么才能取得全胜。业界认为,第四梯队危机的出现,有利于实力强大的第二梯队靠着服务质量与效率抢占退出的小作坊留下的市场空白。 新阶段与新竞争 数据标注和采集是一个技术活。 需求来到,采标公司做两个方面的工作,一,调配和研发模块,二,进行试标,并尝试总结规则,并培训。做完了这两方面的工作,公司会向需求方报价,报价过程中,采标公司回去准备相关应标材料或者应答材料。 中标之后,采标公司开始传输数据,上传到平台上,并开始配置生产和标注业务。据悉,数据标注业务的配置是一个复杂的数学模型。比如,有些任务需要串并联的工作流,并联的工作流是多人协同的工作。串联的工作流是后一个结果是基于前一个结果进行处理的,串并联的工作流需要平台来实现业务工作流的配置。比如一些NLP型的文本标注作业,需要多个人来标,最后N选一或者投票。串并联配置涉及到底层数据流的分发等。 标注过程中,质量的协同管理和绩效的统计非常关键。平台需及时统计到每个人的准确率、稳定性以及效率。标注完了之后,客户验收前,采标公司还需要抽检。最后,公司按照与客户约定的格式进行交付,这又涉及到格式转化的问题。 以上过程包含了整个标注系统所有的技术核心点。标注和采集服务并不是堆人就能够干出来的。对于依靠人力的第三、第四梯队来说,贾宇航认为,如果它们想转型众包+工具的新生产方式,“局限性比较大”。理由有二: 一,数据行业的领头者会通过这3年的持续服务,在客户圈赢得口碑,品牌效应会给其带来一定的商业积累。一些更在意质量、更在意投入产出比的公司会逐渐向领头者们倾斜。二,技术优势。头部标记公司有资金去优化自己的工具和应对客户的定制化需求,并通过管理经验优化对应的服务体系和流程。而对于小团队想要快速建立已有工具和流程化体系去覆盖一个或多个行业是有局限性的。有两条路可供它们选择,第一,精简团队,专营一个或几个AI公司的业务,做一个小而美的生意;第二,与精英合作,使用精英提供的工具,做平台分配过来的任务。 对于尚未入场的后来者来说,如果后来者一开始便立志做一个众包+工具的平台,除了克服商务壁垒外,在众包方面,众包平台需要强运营能力,需要足够多的人在平台上。平台方需要考虑如何拉新,如何保留日活、月活等。在工具方面,只有一个可采标的APP也是不够的,没有便捷的沟通方式减少误差的传递,也是很难做成的。这就像木桶理论一样,缺一块板都装不了水。换言之,留给新进入者的窗口期逐渐关闭。 业内人士认为,采标市场将进入战国争霸期。实力强大的第二梯队之间不可避免地面临着一场混战。数据采标市场开始趋于统一。第一梯队注定不会成为争霸期的主角。因为行业竞争等方面的考量,采标需求方不会将数据交给百度、京东的众包平台来做。做人力资源外包的上市公司会在下半场拿到一定比例的市场份额,会对五家标采公司造成一定的威胁,但该威胁不大。 下半场,第二梯队将如何竞争?通过与第二梯队中的三家公司深入交流,黑智发现它们对未来和竞争理解各异,布局也不尽相同。这些差异在它们诞生的那一刻起,便被注定。 1.做轻还是做重? 在回答“做轻还是做重”这个问题上,龙猫数据、Testin云测、倍赛 BasicFinder给出了不同的答案。Testin云测、倍赛 BasicFinder都建有自己的标注团队,而龙猫数据则坚持用众包的形式来做标注。 不同选择的背后,是各家不同的基因。Testin云测成立于2011年,以App兼容性测试作为切入点,进入企业服务,后衍生出功能测试、自动化测试、安全测试、性能测试等服务,成为一站式测试平台。2017年,Testin云测积累了大量客户。一些AI公司找到云测,希望通过云测的众测平台做数据采集。这是Testin云测采标业务的起点。 Testin云测的采标业务做得很重,比如除了众包采集外,它还会做定制化场景采集,甚至和横店影视基地合作,利用横店群演资源,搭建专属场景,完成客户的定制化场景采集。在标注方面,Testin云测又自建标注基地,与房山市政府合作用于数据标注。贾宇航表示,Testin云测所做的一切都是为了客户需求,“通过工具研发驱动保障标注的效率、精度,以及安全性。并通过项目管理、风控管理等方式,确保标注精度达到客户标准,以满足客户对于准确度的要求。” 从倍赛BasicFinder的产品基因上来看,倍赛的工具偏向于团队模式的管理工具,而不是众包模式。2018年12月,倍赛并购了欣博友,前面提到欣博友是一家运营了30年的北京数据处理公司。该公司提需求,倍赛做技术支持。“我们迭代了很多次,每个工具、快捷键、每个设置的优化,都是我们在数据生产中磨合起来的。倍赛接业务比别的公司都晚,2016年基本没接业务,2017年才开始接。我们的工具做得很扎实。” 除了欣博友,倍赛BasicFinder一直在积极拓展产能,杜霖说,目前,倍赛BasicFinder又拓展了将近3000多个人的子工厂。“通过拓展自有产能,实现最专业的服务。”2018年9月,倍赛BasicFinder收购丁火智能100%股权。丁火智能旗下“荟萃APP”已积累数十万活跃众包用户。“我们搭建了一套自主采集系统,再搭配荟萃APP实现数据采集,完成更多样性的任务。” 和Testin云测、倍赛BasicFinder不同,龙猫数据没有自己的标注团队,工具偏向众包模式。昝智和联创,出身于互联网公司,他们更希望用互联网平台化的方式去做采标,而不是“做一个纯的数据工厂”。昝智既往经验告诉他,应该让系统做这些复杂的数据处理,而不是靠人对人的管理。因为人对人的管理非常低效。 据昝智介绍,龙猫数据是较早使用众包模式做数据采标的,“我们用众包把事情做成了,很多跟进者也开始用众包去做。”昝智认为,龙猫数据打造出了“倚天剑”。他不觉得学龙猫数据的人能够做好众包,“早进入这个行业的玩家,有一把宝刀,他们用这把宝刀获得了利益,然后看到别人拿了倚天剑获得了更大利益,为了造倚天剑,他不可能把宝刀丢了。刀丢了,他们可能啥都没了。但不丢刀,他们又很难造出倚天剑。因为人的精力是有限的,思维是局限的,他们不可能一边把精力放在宝刀上,又一边造倚天剑,而且造倚天剑还比我们造得好,这不科学。” 昝智认为,龙猫数据没有宝刀,“接到客户需求,我们只能优化系统,才能保证准确产出数据。对于他们来说,接到客户需求,他们还有退一步的路可以走,那就当场监督大家认真去干。他们是有退路的,我们也没有退路,我们必须把它搞定。有退路的时候,人一急了,就容易选退路了。”据了解,目前,龙猫众包平台有400多万用户,其中只有一千多是做标注的。龙猫数据的标注业务主要由一千多个渠道商团队承担。 2.建模还是不建模? 贾宇航提到数据标注的产业链可分为三个部分:人员、工具以及算法。而Testin云测坚持做好人员+工具,不做算法。“数据具有可复制性这一特点,如果采集标注公司会算法,这有点像一个算法公司找另一个算法公司做标注,这一份数据到底是否用于乙方的提升,这中间存在一定的争议。”“我们是在数据领域服务的企业,而不是卖算法的公司。我们只负责完成企业的数据采标需求就可以了,完成了交付,我们将彻底清除客户数据。” 杜霖或许不会同意贾宇航的观点,因为倍赛 BasicFinder正在打造一款傻瓜式建模系统——用户只需要输入数据,便可以得到一个AI模型。“如果客户想成立AI部门,只需要部署上倍赛的系统上,然后再找两三个AI工程师调参,就可以自己出模型了。如此,标注、采集、建模就会变成一个大闭环了,因为客户懂业务,他知道业务数据应该是什么样子。”杜霖说。 现在,倍赛BasicFinder避免直接建模,杜霖强调,“我们将我们自主研发的私有化标注系统及主流的深度学习框架,统一封装进倍赛的AI基础系统BasicAI,实现AI数据及模型的整个生命周期管理。倍赛不建模,我们只给客户提供一套底层工具,让客户自己去建模。”杜霖解释说,“Tensorflow、Keras及Pytorch这些深度学习库的出现,让建模没有门槛,未来甚至高中生都能够建模。” 如果一个 汽车 公司让倍赛BasicFinder帮忙做一个自动驾驶系统,杜霖表示做不了。但他也说,“我们的BasicAI实现从标注到建模的高效流程管理。客户在倍赛标数据,数据流到建模平台,客户在Tensorflow里调点参数,模型就出来了。” 今年,倍赛将推出3.0新版本,同时提供SaaS化标注工具服务,帮助客户实现数据标注管理。杜霖提到,为团队打造的采标及建模流程化工具,可以提高倍赛的业务延展性,提高竞争中的优势。 选择无优劣,但市场会给所有选择一个清晰的答案。而战国混战,或在接下来的几年见分晓。不过,客户并不希望一家独大,大树之下,寸草不生的局面。未来,数强并立的局面或将长期存在。 走向终局 一个场景,一个市场,一个产业,一个江湖。 熙熙攘攘被裹挟着进场的人,有的主动选择,有的则是被动,但一旦进入,市场和资本的逻辑发挥作用,他们你我都变成生产链上的生产要素,被挑选,被进步,亦或被淘汰。 各个产业参与者的位置,从诞生起或已被注定。从产生的那一刻起,它按着既有逻辑在走,从不以个人意志转移。上半场,草根英雄辈出,拼价格,下半场拼品牌、服务与效率。精英开始清场,草根离场或者重新站队。而资本,加速整个产业迭代。 现在,下半场刚开启,谈终局似乎有些为时过早。有太多的不确定将在接下来几年的竞争中,变得确定。但更多的不确定性,可能又会出现。城头变幻大王旗,只在一瞬之间。 黑智认为接下来几年,不确定性虽是主流,但仍有几件事是确定的: 1.下半场仍将是性价比之争。客户永远希望用最小的成本获得更高质量的数据。为了生存和在竞争中脱颖而出,供给侧不得不迎合性价比需求,他们不得不通过技术来获得降价空间和利润空间。贾宇航觉得,技术永远是最重要的。“通过技术的方式倒逼自己不要赚太多钱。如此,价格才能降下来,竞争力则提了上去。” 2.不要忽视传统公司的AI需求。毫无疑问,接下来几年,传统企业的AI需求将会出现井喷,如何抓住他们,并服务好他们,这是所有采标公司亟需思考的。当然,也不能忽视AI行业的新数据,比如3D的激光雷达以及心跳数据等。 3.不能忽视商务能力。不强的商务能力,或将成为采标公司的新短板。现阶段,它们的产品和商业模式已基本经过市场的验证。他们需要通过放大商务杠杆扩大产品的覆盖范围。 4.建立第二条增长曲线。接下来几年,有人离开,有人留下。每个人都有所归属,在产业链上,支配或者被支配。所有留下的公司都应该寻找第二条增长曲线,如此才能突破现有成本收益的限制。另外,张三的梦仍需要做,仍需要努力实现。梦想总是要有的,万一实现了呢。(注:张三为化名)
2023-06-29 20:55:591

什么是语音数据标注?海天瑞声的语音数据标注怎样呢?

语音数据标注就是对语音数据进行语义、语法、音素等多种层次的标示,让机器从中学习规律,以便实现人机语音交互技术的实现。我们没有跟海天瑞声合作过,但是海天瑞声是国内唯一一个有能力做多语种语音数据转写和标注的供应商,数据质量应该不错。
2023-06-29 20:56:093

北京海天瑞声科技有限公司跟阿里巴巴有什么关系吗?

没有关系,只是他的业务可能会给开阿里店铺提供一些帮助,公司本身和阿里巴巴没有关系
2023-06-29 20:56:162

数据标注的任务是从哪来的

目前对于数据标注众包平台而言,其任务主要来源于提出标注需求的人工智能公司。从专业大型的数据服务外包公司接单,如数据堂、倍赛、海天、数加加这类规模比较大的公司他们有大。量的投资人行业资源对接,行业影响力大项目相对来说比较多。有部分公司或者工作室他们有大的数据外包公司人脉资源,从而能获得相对多的项目。就是从有些公司接二手三手的标注项目,这类公司在行业QQ群,帖吧非常活跃他们这种公司就是以接包转。百度、京东、科大讯飞,这类头部企业信誉是不会有任何问题的,加入门槛也高,他们本身项目众多但参与做项目的团队人数也众多。龙猫、海天瑞声、数据堂、数加加、倍赛这类专门做数据服务的公司,他们主要以承接甲方项目然后外包为主,做这类平台的业务基本上公司有实力,团队大,有关系渠道,数据质量稳定,个人或者小工作室基本上就接不到这种项目的。
2023-06-29 20:56:261

有没有推荐的数据标注的兼职平台?

1.通过我们调查,目前网络上还没有正规专业的数据标注兼职平台。因为数据标注项目的特殊性,有许多项目也是无法通过兼职平台来放任务的。2.目前数据标注主要还是通过众包 ,分包任务的形式来分发任务3.目前适合个人兼职的数据标注平形式主要有以下几类a. 百度众包、京东众包、科大讯飞这类平台 也有很多适合个人的项目,这种大平台信誉价格方面都可以保证的b. 还有就是目前主要的数据标注兼职途径,这类就是 微信QQ社群里面好多手上有项目的公司他们通过微信QQ群招收兼职人群做任务,这类途径的任务有些会因为信誉问题辛苦劳动而不结账找不到人的。c. 数加加、数据堂等信息小程序的任务形式 ,这类平台一般价格低d.像猪八戒这种微客平台,走任务担保形式。f. 还有就是如找标注网这种专业的找标注项目,找标注团队,标注数据采集,供需双方信息交流数据标注接单平台,平台上活跃着相当多的项目团队,标注项目完全需要供需双方商谈。人工智能产业的迅猛发展带来与之相关的数据产业的爆发性成长,人工智能相关的数据标注需求是庞大的。数据标注是人工智能产业的基础,是机器感知现实世界的起点。从某种程度上来说,没有经过标注的数据就是无用数据。由于数据标注行业的行业入门门槛低,从而带动了大批数据标注从业人员,从业人员的大量增加对项目需求就会越来越多,也因此找数据标注项目、找数据标注团队、数据采集需求的综合性供需平台显的非常有必要。数据标注项目从哪里接单?这些问题受到广大从业人员的格外关注。我们对行业进行分析调查之后,给大家介绍目前有哪些靠谱的数据标注接单平台:一、百度、京东、科大讯飞,这类头部企业信誉是不会有任何问题的,加入门槛也不高,他们本身项目众多但参与做项目的团队人数也众多。二、龙猫、海天瑞声、数据堂、数加加、倍赛这类专门做数据服务的公司,他们主要以承接甲方项目然后外包为主,做这类平台的业务基本上公司有实力,团队大,有关系渠道,数据质量稳定,个人或者小工作室基本上就接不到这种项目的 三、类似集合找数据标注项目,找数据标注团队 、数据采集供求,信息经验交流的平台,这类平台目前很少,大平台更少。目前就找标注网平台还算是人气项目比较活跃的,这种平台符合满足了工作室、个人,公司项目方的多样需求,但是信誉方面需要项目合作双方自己去判断。以上这些是目前小编整理出的相对来说靠谱的数据标注接单平台,希望对大家有帮助。
2023-06-29 20:56:448

需要采集一批语音数据及标注,众包平台和专门的语音采集提供商哪个比较好?

众包平台现在有挺多的,数据量大,价格低,但是确实数据和标注质量比较难保证吧,预算充足的情况下,还是选专业的公司比较好,毕竟再便宜的数据不能用也白搭,预算紧张可以选择现成的数据集产品,推荐海天瑞声,应该是业内数据集量级Top1了。
2023-06-29 20:57:021

目前国内数据标注市场规模如何?

数据标注为通过分类、画框、标注、注释等,对图片、语音、文本等数据进行处理,标记对象的特征,以作为机器学习基础素材的过程。中国数据标注行业参与企业类型按参与模式主要分为众包和自建工厂两种模式,其中,众包模式主要包括百度众包、京东众智、龙猫数据等;工厂模式主要包括贝赛、云测、爱数智慧、海天瑞声、阿里数据标注、元坤智能数据、点我科技等。头部企业为自建数据团队,中小数据供应商占比较大目前,我国国内数据标注市场第一梯队包括头部公司组建自己的数据标注部门,京东(京东众智)、百度(百度众测)、腾讯、阿里(阿里数据标注)都已经拥有自己的标注平台和工具。头部公司之外,国内近年兴起众多数据标注公司,如龙猫数据、Testin云测、倍赛BasicFinder、数据堂等。这些公司仅次于头部公司,都具有相当的规模,位于第二梯队。在中国数据标注行业参与主体中,按规模划分,品牌数据服务商、中小数据供应商和需求方自建基础数据团队构成市场竞争关系,为AI数据标注市场的主要供应方,在2019年AI数据标注市场份额占比分别为30.4%、47.0%和22.6%,目前中小数据供应商是市场中的主要供应力量。按模式分为数据标注公司和众包平台,服务领域广泛中国数据标注行业参与企业类型按参与模式主要分为众包平台和自建工厂(专业数据标注公司)两种模式。2020年数据标注公司排行榜中,Testin云测、数据堂、龙猫数据位居前三;数据标注众包平台排行榜中,京东众智、百度众测、数据堂位居前三。从数据标注代表企业业务布局来看,大部分数据标注服务商提供文本、语音、图像、视频等各类型数据标注,服务应用领域涵盖安防、智能驾驶、医疗、教育、金融等多个领域,主要客户包括科技公司、人工智能企业、传统企业、政府部门、科研机构等。业务偏重视觉类的企业多拥有自建标注基地,多分布在山西、河南等地AI数据标注业内玩家按照业务方向和进入市场的时机可做粗略划分,包括早期进入玩家、中晚期进入玩家、偏重视觉类业务玩家、偏重语音类业务玩家等。其中,业务更偏重语音类数据的玩家,通常拥有较多的自有知识产权数据集;拥有自建标注基地或全职标注团队的则多为偏重视觉类的玩家。作为人工智能产业链中必不可少的一环,发展AI数据标注服务成为了各地方推进AI建设的重要方向之一,贵州、山西、重庆等地相继出台指导意见,引入科技公司,共建数据基地、数据交易中心,打造具有地方特色的人工智能产业园。目前,众多数据标注公司自建标注基地或团队,如百度的“百度山西的AI数据标注基地”、“百度大数据百鸟河基地”,数据堂的“数据堂保定数据加工基地”、“数据堂合肥数据基地”、“数据堂北京TTS录音中心”等,多分布在山西、河南等地。北京、上海、成都为需求企业分布前三地区,杭州数量下滑从需求企业来看,根据AI数据标注猿统计数据显示,2020年4月,国内数据标注业务相关公司数量为565家,2020年12月,数量增长至705家。从数据标注需求企业地区分布情况来看,截至2020年12月,北京、上海、成都、深圳、杭州为数据标注企业分布TOP5城市,企业数量分别达到185家、84家、68家、63家、46家;其中北京、上海、成都、深圳企业数量均较2020年4月有所上升,杭州企业数量较2020年4月有所下降。市场集中度较低,未来将有所提升,行业并购成为趋势2019年,AI数据标注行业CR5(前五大企业市场份额)为26.2%,处于低集中竞争阶段,行业活力充足,发展空间良好。前五大企业中,海天瑞声与百度数据众包越众而出,据了解,国内整体供应方中,以提供图像类数据采标服务的公司居多,内容涉及人像数据、OCR数据、自动驾驶数据等,业务需求较为分散,其中以百度数据众包营收份额占比最大。相比而言,语音类数据需求较为集中,且供应门槛高于图像类数据,内容包含语音识别数据、语音合成数据等,其中以海天瑞声营收份额占比最大。目前人工智能数据标注行业集中度较为适中,既非寡占型市场也非充分竞争市场,这一方面是由于百度数据众包、海天瑞声、数据堂等企业进入市场较早,积累了较多客户资源,另一方面则是由于下游企业之前多采用公开数据集训练模型,对数据的高精度要求由来尚短,受生态传导效应滞后影响,市场门槛还不显著,资金与研发实力较为薄弱的中小企业还有较强的发展土壤。然而未来,随着下游企业发展壮大,直接使用外包团队成本低廉、数据安全可控性强,一些基础性需求将由下游企业自给自足,外部的数据服务商现有的存量市场面临下降,因此必须承担高难度、前沿独特性任务,这就要求其自身投入高精度、专业化数据处理工具的研发和人工智能算法基础研究,以把握客户需求,开拓增量市场,因此资金与研发实力成为较高行业门槛,同时受近年资本市场冷却影响,一批中小型厂商面临业务收缩,再者部分厂商如倍赛开始在业内并购,参考海外数据服务市场发展情况(海外行业巨头Appen多次并购其他企业),并购也将成为市场趋势,多种因素叠加影响下,行业集中度将提升。综上,未来数据标注行业兼并与重组将成为大势所趋。目前,国内较为典型的并购事件为倍赛BasicFinder收购专业的人工标注服务商荟萃,以此丰富自主数据采集系统,从而完成更具多样性的任务。全球数据标注行业兼并重组步伐加快。一方面头部企业逐渐收购中小微数据平台,将自己的议价能力提高到新的水平,在此背景下,全球数据标注行业市场集中度进一步提升。数据标注行业的并购重组规模将持续增长,行业的竞争将愈发激烈。—— 更多数据来请参考前瞻产业研究院《中国数据标注行业市场前瞻与投资战略规划分析报告》
2023-06-29 20:57:1113

“亏损股”科大讯飞缘何成为机构抱团新宠?

近期科大讯飞被百家机构扎堆调研,有成为“报团新宠”的势头。另一方面,公司“大动作”频频,包括人事变动,管理架构调整,业务布局进入收获期,基本面拐点已现。这或许是其近期走势强劲,市值突破千亿的新逻辑。 2月28日公告显示,科大讯飞又迎来近百家机构调研。自去年7月起,科大讯飞调研热度明显提升,百余家机构扎堆调研,似乎暗示着公司有望成为机构报团新宠。 此前,由于科大讯飞的人工智能业务增收不增利,在资本市场一直饱受争议;再加上其业务比较复杂,投研的性价比比较低,机构积极性一直不高。作为一家市值千亿的巨无霸,科大讯飞的基金持股比例却大幅低于同业,可以称得上是大公司中的“机构冷门股”。 值得注意的是,近期科大讯飞动作频频,业务结构与业绩表现似乎都将迎来基本面拐点。随着人工智能行业景气度提升,行业独角兽逐个上市,科大讯飞作为A股人工智能老大哥,估值也有望水涨船高。 机构扎堆调研 去年以来,科大讯飞的机构调研热度显著提升。而此前科大讯飞机构参与度极低,2020年二季度末,公司基金持仓比例在计算机板块市值前十大的公司中位列倒数第二,远低于平均水平。 2020年年内,科大讯飞被机构调研了15次,相当于2016-2019四年的调研数总和, 在2019年全年披露的投资者关系活动仅1次,2018年则为5次。具体来看,其中多次调研活动中机构数破百,使得科大讯飞频频摘下A股上市公司受机构调研榜单的桂冠。 分析观点认为,此前科大讯飞机构持仓较少的重要原因是,其业务线过于繁杂,深入跟踪的性价比不高。 公司涉及教育、政法、消费者、智慧城市、医疗、 汽车 等诸多行业,且部分业务线中包含多项细分业务,研究成本过高。如今公司与行业面的边际变化已经非常确定,于是在研究成本和持仓错配的情况下,市场资金逐步开始选择介入。 不过从近期行情来看,科大讯飞震荡剧烈,机构似乎正处于观望博弈阶段。 股价上,在2月23日一举涨停,创下 历史 新高后,科大讯飞迅速迎来一波大幅调整,连续3个交易日跌去15%。如此“过山车”行情并非偶然,仅仅在一个月前,科大讯飞刚上演过相似剧情。1月19日起5个交易日,公司股价连续大涨,累计涨幅近15%,而后5个交易日又跌去近10%。 资金面上,近日科大讯飞交易颇为活跃。3月1日数据显示,主力方面,20日净流出17.5亿元,5日净流出8.9亿元;港资方面,60日净流入11.11亿元,近3日净流出10.07亿元。另外,近60日内发生了10次大宗交易,其中折价交易5次,溢价交易1次。 最近3个月,科大讯飞共登上龙虎榜4次,均显示日净买入高于1.5亿元。具体来看,其中三次为涨停,一次为跌停;其中三次日成交额超35亿元。1月21日,科大讯飞当日净买入高达6.63亿元,当日成交额高达68.02亿元,也显示出交易热度之高。 值得一提的是,2月3日科大讯飞的大跌为午后股价闪崩,最终封死跌停板收盘,当日成交额超40亿元,市值跌破千亿。盘后数据显示,深股通买入4.4亿元并卖出2.9亿元, 两机构合计卖出1.43亿元。 对于股价大幅波动引发的市场顾虑,科大讯飞的回应方式是:上调全年业绩预告区间下限。 闪崩当日科大讯飞便发布公告表示,由于第四季度经营持续向好,根据最新财务审计工作进展,业绩预期范围进一步明确至:2020年度累积净利润为12.29-13.93亿元,同比增长50%-70%。 而根据公司于10月27日发布的三季报,公司全年业绩指引为,预计2020年实现净利润10.65-13.93亿元,同比增长30%-70%。也就是说, 更新后的版本将区间下限提高了20个百分点。 公司“大动作”频频 去年以来,科大讯飞在高层架构与业务战略上“动作频频”,转型改革提速。提升经营效率 人事架构方面,公司一年内共发布了7次人事变动公告,管理架构改革加速,如今已推进至“专制总裁制”。 2月7日,科大讯飞发布重磅人事变动,为了使董事长的精力更多地集中于公司未来发展战略、公司核心机制的建设,同时加强人才的培养,董事长兼总裁刘庆峰将辞去公司总裁职务,并聘任吴晓如先生为公司总裁,负责公司常规经营管理工作。 据悉,2009年4月以来,主持公司生产经营管理工作的总裁职务一直由公司董事长兼任,处于集中式管理的状态。为了实现更好的分级管理,公司自2014年开始 探索 实行“轮值总裁制”,初步在内部管理上实现分工;如今演进至“专制总裁制”,分工放权后,公司经营效率有望进一步提升。 经营业务方面,随着各行业智能化应用加速,公司产品化不断推进,规模效应与盈利能力有望进一步提升。 在教育业务上,去年以来,科大讯飞连续中标区域性教育项目大单。2020上半年,公司教育领域中标金额同比增长175%。其中蚌埠市智慧学校建设项目中标金额为15.86亿元,青岛西海岸新区“因材施教”人工智能+教育创新应用示范区项目中标金额8.59亿元。目前,上述两大项目已基本完成年内交付计划,产品已进入常态化使用。 在医疗业务上,科大讯飞也有望进入收获期。公司自2015年开始布局医疗业务,2019年实现盈亏平衡。目前讯飞智医助理已在西藏、内蒙、青海、浙江、北京、广东、福建等共计11个省近百个县区,超过2000个乡镇及医疗机构,超过2万个村级医疗机构投入使用。 值得一提的是,近期科大讯飞实控人强势“包揽”20余亿元大额定增,也彰显了对公司未来发展的信心。 1月19日,科大讯飞公告称,拟向实控人之一刘庆峰及其控制的企业言知 科技 定增募资20-26亿元,扣除发行费用后将全部用于补充流动资金。发行价格为33.58元/股,发行股票数量5956-7743万股。 科大讯飞表示,公司实控人刘庆峰先生与公司长期利益休戚与共,定增完成后将强化公司控制权稳定性。定增前,公司实控人刘庆峰和科大控股合计控制公司16.17%股份的表决权,处于较低水平。按照发行上限测算,本次定增完成后,公司实控人控制表决权的比例变为18.99%,巩固了控制地位。 另一方面,本次发行后公司将获得充足的流动资金,有利于优化公司资本结构,提高抗风险能力,进一步满足核心业务增长与业务战略布局需要;也有利于公司在快速发展的人工智能行业抢抓战略先机,引领行业发展。 AI股元年,推高估值 从行业层面来看,人工智能产业加速发展,景气度不断推升,有利于科大讯飞收获更高估值。 首先是需求端的增长。受到2020年新冠疫情的催化,AI应用加速普及,如今已广泛运用在机器人筛查、影像辅助诊断、远程教学、无人配送等领域。后疫情时代,在教育、医疗、物流等AI应用的重点赛道,或能很快看到外部需求爆发的拐点。 其次是政策端的支持。2021年作为十四五规划开局之年,也将对人工智能行业发展起到助推器的作用。有专家指出,结合多年前我国新一代人工智能发展规划中提出:预计到2030年,人工智能核心产业规模超过1万亿元,带动相关产业规模超过10万亿元,培育高端高效的智能经济,预示着对于深耕人工智能赛道上的玩家将会迎来更大机遇。 更重要的是,随着AI独角兽们带着一级市场的高估值密集登陆科创版,科大讯飞作为A股AI龙头,以及行业中为数不多实现盈利的公司,估值也有望水涨船高。 资料显示,随着2019年科创板开通,人工智能企业上市进程明显加速。2019年虹软 科技 (机器视觉算法)登陆科创版;2020年,石头 科技 (智能扫地机器人)、寒武纪(AI芯片)、九号公司(智能电动滑板车)等公司也紧随其后。 目前还有海天瑞声、依图 科技 、云知声、云从 科技 、云天励飞等多家AI领域公司已披露招股说明书,此外,同为AI四小龙的商汤 科技 、旷视 科技 等也曾报道过拟上市的计划,业内人士预计,2021年将是人工智能企业IPO大年。 对于2020年业绩高增长,并且在2021年AI与新能源车的双重风口下,科大讯飞的中长线机会或许才刚刚开始,甚至有市场人士将长期估值看到近两千亿。 有分析师估测称,考虑到人工智能产业加速趋势,公司龙头溢价,以及业绩/产品化率提升趋势,予以科大讯飞“买入”评级,2021年12倍PS,目标市值1986.5亿。
2023-06-29 20:59:181

科创板9家企业排队上会,未来节奏加快,或将一周9家

第三批科创板上会企业出炉。6月3日,上交所发布科创板上市委2019年第3次审批会议公告,上市委定于6月13日审议澜起 科技 、天宜上佳、杭可 科技 三家企业的首发上市申请。 至此,已经有三批、9家企业即将上会。其中,微芯生物、安集 科技 、天准 科技 即将于明日率先接受上市委的“终极考验”。科创板开板时间渐行渐近,有业内人士认为,未来上会节奏会加快,可能达到2天3家、一周9家的节奏。从审核问询速度来看,第三批上会企业显得更快。前两批上会企业大部分为3月份获得受理,第三批上会企业均为4月份获得受理。按受理日期到上会日期之间间隔时间来看,第一批企业平均为67天,第二批平均为77天,第三批平均仅64天。 第三批上会的三家企业均经历了三轮问询。 此外,天宜上佳6月2日披露第三轮问询回复,杭可 科技 6月3日下午刚刚披露第三次问询回复,澜起 科技 也是6月3日才披露审核中心意见落实函的回复。可以说三家企业是“跑步”进入上会队列。 而三家企业在6月2日、3日还在披露最新问询回复文件,6月3日上交所即公布上市委会议公告,审核节奏之快可见一斑。 根据会议公告,第3次上市委审议会议的参会上市委委员依然为5名,分别为汤哲辉、张小义、陈春艳、管红、苏星。记者注意到,其中基金业协会秘书长陈春艳同时也是第1次上市委审议会议的参会委员,也就是说,其在8天时间内要参加两场审议。上市委委员或将开启“连轴”模式。 另外,本次参会委员中首次出现了来自上市公司的人士——中国船舶重工股份有限公司董事会秘书管红。按照《上海证券交易所科创板股票发行上市审核规则》(下称《审核规则》),每次审议会议由五名委员参加,其中会计、法律专家至少各一名。此前两次上市委会议的参会委员,会计、法律专家一般来自会计师事务所、律所或高校,再加上来自证监会系统、交易所、行业协会的专业人士。截至6月3日晚间,已经有三批、9家企业等待上会。 第1次上市委审议会议与第2次审议会议之间相隔6天,第2次与第3次审议会议之间仅相隔2天。有投行人士表示,第1次与第2次会议间隔多了几天是因为中间有一个端午节假期,未来科创板上会可能会是2天3家、一周9家的节奏。 在时间安排上,企业从进入上会名单到实际上会间隔时间为7个工作日,但上会当日审议结果即出炉。 根据《上海证券交易所科创板股票上市委员会管理办法》,审议会议召开七个工作日前,上交所公布审议会议的时间、拟参会委员名单、审议会议涉及的发行人名单等,同时通知发行人及其保荐人。审议会议结束当日,上交所在网站公布审议意见及问询问题。也就是说,接受“首试”的三家企业6月5日当天即可知晓自己的“考试成绩”。 在具体的审议内容方面,上市委首先需要对交易所审核机构提出的审核报告和初步审核意见进行审议,重点从审核机构的审核问询是否有重大遗漏、发行人及中介机构的回复是否充分、审核机构初步意见的形成过程和判断依据是否合理,相关信息披露文件是否有利于市场判断和投资者决策等角度,发挥把关和监督作用。在对交易所审核报告和初步审核意见进行审议中,参与审核的上市委委员对招股说明书等信息披露文件也会进行审阅,提出需要问询发行人和中介机构、提交上市委会议讨论的问题,但需要避免对发行人信息披露文件进行不必要的全面重复性审核。 上市委形成同意或者不同意发行上市的审议意见后,上交所出具同意发行上市的审核意见或者作出终止发行上市审核的决定。上交所审核通过的,向中国证监会报送同意发行上市的审核意见、相关审核资料和发行人的发行上市申请文件。 企业通过审议会议的可能性有多大?目前市场预计,较大概率企业会高比例通过,甚至全部通过。上市委审核会议是合议制,按少数服从多数的原则形成审议意见。有投资界人士表示:“上市委不同于发审委,更多的是以初审意见为最终意见,大家合议一下,一致通过。”6月3日晚间,上交所一次性受理了4家企业的科创板上市申请,包括广州洁特生物过滤股份有限公司(简称“洁特生物”)、绍兴兴欣新材料股份有限公司(简称“兴欣新材”)、无锡德林海环保 科技 股份有限公司(简称“德林海”)、普元信息技术股份有限公司(简称“普元信息”)。 从5月份开始,上交所新增受理企业的速度明显放缓,一次新增受理企业数量不超过3家,并且常常间隔两三天才新受理一家企业。整个5月仅新增受理15家企业。 与新增受理放缓相对应的是,已受理企业的问询回复进入快速推进期。截至目前,科创板受理企业共117家,其中处于“已受理”状态的有17家,处于“已问询”状态的有96家,另外还有4家处于“中止”状态。 6月3日,安恒信息、光峰 科技 、乐鑫 科技 3家企业公布第三轮问询回复,沃尔德、海天瑞声2家企业公布第二轮问询回复。至此,已经有13家企业完成三轮问询回复。58家企业完成二轮问询回复。 从目前已经确定上会的9家企业来看,有6家企业经历了三轮问询,另外3家企业仅经历两轮问询。3家仅经历两轮问询即上会的企业中,安集 科技 首轮问询共49个问题,第二轮问询仅11个问题;天准 科技 首轮问询44个问题,第二轮问询14个问题;福光股份首轮问询57个问题,第二轮问询减少至12个问题。第二轮问询的问题数量整体来看较少。 从目前的审核进展来看,三轮问询并非必备审核步骤,更关键的是提升申报材料的完备性,以减少问询的轮次和问题的数量。“越早申报的并不一定能越早上会,也不一定能越早上市。”有券商人士表示。
2023-06-29 20:59:351

大家都是在哪些网站找数据?

为了找到PC市场的出货量数据和预测,发现了一个不错的数据统计网站:The Statistics Portal包括非常多行业的数据,真的做得很好!!Statista最初完全免费,网站靠广告获得收入,现在用户要想获得完全数据库访问,则需要购买价格为每月49美元的付费账号。免费的basic账号只可以使用约7%的数据库。Statista的数据来源中,内部自有调查统计数据占25%,来自合作伙伴的二手数据源占45%,还有30%的数据来自公开数据。海天瑞声Speechocean,貌似是做的挺专业的,百度apistore上有,另外apistore本身就又不少数据语料库在线、txmall,类似的网站还有,自己百度一下数粮,有点汇总的意思,和百度那个有点像另外楼上提的中科院和数据堂都有,而且都有一些科研类数据还有就是各大学都有各自的库,但是找起来不太容易。
2023-06-29 21:00:213

数据标注的平台哪个好

曼孚科技也挺不错的,我们在汽车自动驾驶领域有过合作。
2023-06-29 21:00:546

海天瑞声为什么买不了

1、该股票停牌:股票当前停牌,无法进行买卖操作。2、无法交易的股民:是由于证券账户问题或资金账户问题。3、未开通股票交易:没有在证券公司开通股票交易,无法购买股票。4、非交易时间:当前不是正常的股票交易时间,无法进行买卖操作。5、卖盘不足:当前卖盘不足,无法购买该股票。
2023-06-29 21:01:091

海天瑞声网上兼职给工资吗

给。在网上做过海天瑞声的兼职任务,语音包的校对和修改,群里的相关负责人都很尽责,有问题随时回答,工作流程也写的很清楚,最后项目结束时,工资下发也很快。总之就是分工明确,效率比较高。北京海天瑞声科技股份有限公司是一家多语言、跨领域的人工智能数据及相关数据服务的提供商。“海天瑞声”也是全球最大的工程化人工智能数据资源供应商之一。截止2019年年底,“海天瑞声”旗下运营的“天籁数据中心”已经拥有近600余个可授权使用的大型工程化数据库,涵盖了150多种语言。其中包括语音数据资源、文本数据资源、图形图像数据资源和视频数据资源,这些数据库都拥有独立的知识产权,并具有不同层级的转写和标注,其数据规模和品质可以完全满足客户在人机交互技术领域的产品开发和模型训练的需要。
2023-06-29 21:01:191

北京海天瑞声科技有限公司 怎么样?他们的小语种兼职靠谱吗?

您好,北京市工商局网站信息显示,北京海天瑞声科技有限公司成立于2005年,注册资本100万元,经营范围:技术开发、技术服务、技术咨询、技术转让、技术推广;销售计算机、软件;企业管理咨询;劳务派遣。(未取得行政许可的项目除外)经营范围内各项,好像都会涉及到小语种。如果我的回答帮到您,请及时采纳。
2023-06-29 21:02:221

室内语音采集,儿童、老人不同性别各500人,还要有家居环境噪音,工期20天,有没有可以做到的供应商?

20天,开玩笑吗,太短了!儿童、老人的发音人本身就难招募,而且又是疫情特殊时期,非常考验数据供应商的资源统筹和专业服务能力,可以问问海天瑞声能不能做到,它们家已经是业内做的很专业的了,建议不要过于赶工期而影响数据质量,得不偿失。
2023-06-29 21:02:301

哪能找到质量比较好的英语女声语音合成库、语音合成训练语料?

大约需要10个小时 、1000句左右就够了海天瑞声有英语女声语音合成库 ,大约是12个小时,5000句话 。你可以去海天瑞声运营的一个数据平台“天籁数据中心”去查查。有时还有免费数据呢,你注册个会员,就能收到免费数据推广了。
2023-06-29 21:02:381

现在车载语音识别系统真的好用吗?为什么有的时候就是听不懂我的话呢?

可能是因为训练车载语音识别系统的语音识别训练语料的问题,对口音考虑的不周全。要用大规模的语音识别数据库,针对你所在地区特定方言口音的语料来训练,效果会比较好,可以试下海天瑞声的语音技术可能会有更多的帮助。
2023-06-29 21:02:483

科创板包容性背后更注重信披质量

“平稳运行。”这是科创板运行9个交易日来,业界普遍给出的评价。 业界认为,科创板更加注重包容性,因此对如何保障平稳运行提出了更高的要求,这背后离不开“加强信息披露”等一系列的制度保障,以保证上市公司质量。这些举措,有助于激发市场活力,完善多层次资本市场体系,有力促进 科技 创新与资本市场的深度融合。 85家企业中止审核原因各异 7月31日晚间,上交所发布消息称,80家科创板在审企业的财务报表已超过规定的有效期,状态变更为中止。 由此,截至目前,申请在科创板上市的中止审核企业数量达到了85家。业界认为,对企业而言,中止审核并不意味着和科创板要彻底说“再见”,等到条件符合之后,仍然可以恢复审核。 根据《上海证券交易所科创板股票发行上市审核规则》,出现七种情形之一的,上交所将中止发行上市审核。其中,第六种情形是“发行上市申请文件中记载的财务资料已过有效期,需要补充提交”。 上述80家企业就属于这一情形。 根据规定,发行人应当在中止审核三个月内补充提交有效文件或者消除主动要求中止审查的相关情况,中止审核的情形消除或在规定的时限内完成相关事项后,经上交所审核确认后,可以恢复发行上市审核。 另一种原因,是相关的中介机构被调查,公司因此受到牵连。 这属于中止审核情形中的第二项,即发行人的保荐人或者签字保荐代表人、证券服务机构或者相关签字人员因首次公开发行并上市、上市公司发行证券、并购重组业务涉嫌违法违规,或者其他业务涉嫌违法违规且对市场有重大影响被中国证监会立案调查,或者被司法机关侦查,尚未结案。 如此前因为广东正中珠江会计师事务所(特殊普通合伙)被证监会立案调查,包括利元亨等在内的3家申请在科创板上市的企业,进入中止审核状态。不过,此后这3家企业陆续进入了正常审核流程。 根据相关规定,证券服务机构因涉嫌违法违规被证监会及其派出机构立案调查,证券服务机构应当指派与被调查事项无关的人员,对该机构或者有关人员为被中止审查的申请事项制作、出具的申请材料进行复核。按要求提交复核报告,并对申请事项符合行政许可法定条件、标准,所制作、出具的文件不存在虚假记载、误导性陈述或者重大遗漏发表明确复核意见的,证监会应当在30个工作日内恢复审查,通知申请人。 7月28日,杰普特、建龙微纳、国科环宇和国科环宇四家在审企业中止审核。这四家企业的会计师事务所均为瑞华会计师事务所。 因康得新财务造假事件,康得新的审计机构瑞华会计师事务所(特殊普通合伙)被证监会立案调查。 除了以上两种原因,5月12日中止审核的九号智能,是因为今年4月上旬,公司将投资者持有的优先股转为普通股。根据相关要求,因为需要增加一期审计(截至2019年6月30日),公司申请中止审核以完成加审工作,并更新申报材料。 九号智能使用的是第七项,即“发行人及保荐人主动要求中止审核,理由正当并经上交所同意”。按规定,发行人应当在中止审核后三个月内补充提交有效文件或者消除主动要求中止审核的相关情形。 除了85家中止审核企业,还有4家企业终止审核,分别是木瓜移动、和舰芯片、诺康达和海天瑞声。 据了解,上述4家企业均为主动撤回。而在终止审核前,4家企业处于不同的审核进度和程序中,有的处于多轮问询阶段,有的保荐机构被现场督导,有的已召开中心审核会议形成初步判断意见,有的已正式发布公告进入上市委会议审议程序。 要多方面发力为科创板把关 7月30日召开的中共中央政治局会议提出:科创板要坚守定位,落实好以信息披露为核心的注册制,提高上市公司质量。 这是继4月19日提出“要以关键制度创新促进资本市场 健康 发展,科创板要真正落实以信息披露为核心的证券发行注册制”之后,政治局会议年内第二次提及科创板。 他进一步解释:“坚守定位”意味着未来政策层在监管层面不会放松,监管部门后期可能采取更加丰富的手段提高持续监管能力, 探索 完善与注册制相适应的证券民事诉讼法律制度。这就要求中介机构必须在知法懂法的道路上不断深耕,不断提升尽职调查和核查把关的能力,加强合规风控体系,使科创板在法制、市场和诚信环境的建设上更为完善。 “提高上市公司质量”则意味着中介机构必须做好信息披露核查的把关人,本着真实、准确、完整的原则,合理怀疑、充分询问,切实提升企业信息的透明度和可靠性,避免由信息不对称所带来的预期偏差,使市场在公平公正公开的原则下平稳交易。 他进一步表示,提高上市公司质量的关键,一是科创板要“坚守定位”,不能以注册制增加包容性的名义让缺少 科技 含量的公司上市;二是强化信息披露,包括建立更加健全的信息披露监管制度、严惩企业信息披露出现的违规行为;三是要建立更加严格的退市标准,以市场化的手段优胜劣汰,最终使科创板退市常态化。 交通银行金融研究中心首席研究员唐建伟认为,科创板设置了多元包容的上市条件,有利于多层次资本市场建设,促进直接融资发展,优化融资结构,助推金融供给侧改革。但科创板定位于拥有关键核心技术, 科技 创新能力突出,主要依靠核心技术开展生产经营企业,即“硬 科技 ”企业。 他进一步表示,未来,科创板发展将按照总书记要求“把好市场入口和市场出口两道关,加强对交易的全程监管”,同时,不断完善信息披露制度,建设规范、透明、开放、有活力、有韧性的资本市场,提高资本市场活力,促进直接融资发展和融资结构优化。 她同时表示,科创板的良好发展,对目前已经在A股上市的同行业对标企业而言,也会以科创龙头为榜样,在增量带动存量的推动下,加速发展自己。
2023-06-29 21:03:081

宠物行业上市公司排名

宠物行业主要上市公司:目前国内宠物行业的上市公司主要有中宠股份(002891.SZ),佩蒂股份(300673.SZ),华亨股份(837995/新三板),路斯股份(832419/新三板)等 根据用途划分,宠物食品行业可分为宠物主粮、零食和保健品。2018年,我国宠物主粮、零食、保健品分别占宠物食品市场比值为62.04%、31.42%、6.54%。 由此可见 拓展资料: 中国哪些顶尖宠物 1、Zoetis硕腾 硕腾,原为辉瑞的动物保健部门,如今已跃然成为一家全球性的动物保健公司,致力于为客户及其业务提供有力支持。秉承辉瑞动物保健60 年的悠久历史,我们为用户提供优质的兽药和疫苗、业务支持和技术培训。我们始终不懈努力,并帮助饲养和关爱动物的人们,为他们解决所面临的各种挑战。 2、Merial梅里亚 梅里亚(Merial)是赛诺菲集团的动物保健部门。身为全球动物保健行业的领导者,梅里亚始终以创新为驱动力,为多种动物提供品种齐全的产品,以提高其健康、福祉和体能。 梅里亚中国的前身是成立于1990年5月的江西赛诺菲动物保健品有限公司。梅里亚目前在中国拥有三家合资生产企业和一家贸易公司,主要生产和销售家禽疫苗产品,用于防治感染肉鸡和蛋鸡的各种疾病,并提供相关的免疫器械与免疫配套服务。 3、拜耳BAYER 拜耳公司于1863年由弗里德里希-拜耳在德国创建。1899年3月6日拜耳获得了阿司匹林的注册商标,该商标后来成为全世界使用最广泛、知名度最高的药品品牌,并为拜耳带来了难以想象的巨额利润。 1925年公司同其他几家化学公司合并建立法本化学工业公司,战后被拆散。1951年成为独立的法本继承公司,称拜耳颜料公司,1972年取名“拜耳公司”。 4、Elanco 礼来公司创建于1876年,现已发展成为全球十大制药企业之一。130多年来,礼来始终保持独立。在全球范围内,礼来与众多优秀的合作伙伴一起,以更低的成本开发出创新的药品,为世界上最迫切的医药需求寻找答案。 多年来,礼来一直被评选为全世界最适合工作的公司之一, 我们的员工也始终秉承着“诚信至上,追求卓越,以人为本”的核心价值观。 5、勃林格殷格翰 勃林格殷格翰 (Boehringer-Ingelheim)是一家致力于人类生物制药化学和动物健康产品的医药公司。人类制药部门是该公司最大的部门,约占销售量的95%。这包括了处方药和保健消费品。 她是世界上最大的私有制药企业。
2023-06-29 21:00:441

宠物食品行业市场分析

宠物食品行业主要上市公司:中宠股份(002891.SZ);佩蒂股份(300673.SZ);路斯股份(832419.BJ);华亨股份(837995.OC)本文核心数据:全球宠物食品行业零售市场规模及其占比;全球宠物食品产品结构;全球宠物食品行业销售渠道结构;全球宠物食品行业零售市场规模预测市场规模超1100亿美元全球宠物市场已逐步成熟,宠物食品作为宠物行业的一个重要分支,是宠物市场最大的“蛋糕”。2016-2021年,全球宠物食品市场占整个宠物行业的比重均维持在70%以上,2021年宠物食品占比为71.97%。根据Euromonitor公布的数据,2021年全球宠物食品行业零售市场规模达1149.42亿美元,同比增长11.99%,近5年全球宠物食品行业零售市场规模复合增长率达6.92%。狗粮占比近六成宠物食品根据宠物品种划分可以分为狗粮、猫粮和其他宠物食品。目前全球宠物以狗和猫为主,其他类型的宠物占比较少,因此狗粮、猫粮的占比远超其他宠物食品占比。根据Euromonitor公布的数据,狗粮在全球范围内是最主要的宠物食品细分市场。近年来,随着宠物猫数量的快速增长,猫粮占比有所提高,2021年狗粮在全球宠物食品零售市场规模占比达60%,猫粮占比达36%。主要国家销售渠道差异明显从销售渠道来看,全球宠物食品行业主要以商超渠道、专业渠道、线上渠道和宠物诊所为主。不同国家宠物食品发展历程不同,销售渠道结构也有明显差异。受益于成熟的电商行业发展,中国宠物食品行业的最主要销售渠道为线上渠道,2021年占比高达60.9%;日本宠物食品销售渠道则以专业市场为主,2021年占比为50.6%,其中又以家居和园艺专业零售商占比最高;美国则有着成熟的线下商超渠道,包括沃尔玛等龙头零售商,2021年美国宠物食品行业商超渠道占比为45%。宠物食品行业未来发展前景良好新冠肺炎疫情对全球经济发展造成了巨大的冲击,但受益于宠物需求刚性,全球宠物食品行业的市场规模增长呈现一定韧性。2021年在全球部分地区疫情已经基本控制住的情况下,全球宠物食品行业零售市场规模达1149.42亿美元,以中国为代表的新兴市场的增长为全球宠物食品行业市场规模的增长提供支撑。未来受益于亚太地区等新兴市场消费的快速增长,预计2027年全球宠物食品行业零售市场规模有望达1725亿美元,年复合增长率为7%左右。从区域发展趋势来看,欧美国家的宠物食品行业整体增长空间有限,而亚洲国家的宠物消费市场极具潜力;从产品结构发展趋势来看,欧美国家未来将走“大众优质化”路线,亚洲国家的中高端产品市场份额将有所上升;从销售渠道发展趋势来看,未来线上渠道有较大增长空间。更多本行业研究分析详见前瞻产业研究院《中国宠物食品行业市场需求与投资战略规划分析报告》。
2023-06-29 21:00:561

易方达王元春业绩如何

易方达王元春业绩呈上升趋势。截止2022年二季度末,基金经理王元春旗下共管理2只基金,本季度表现最佳的为易方达消费行业股票(110022),季度净值涨22.31%。
2023-06-29 21:01:191

温州有哪些上市公司?

5家吧,网上应该可以搜索到的报喜鸟刚上市另外有华峰氨纶、浙江东日、华仪电气、瑞立集团。
2023-06-29 21:01:244

易方达环保主题能买吗

1、可以,易方达消费行业股票即易方达消费行业股票型证券投资基金,是由易方达基金管理有限公司作为基金管理人所管理的一支基金,该基金于2010年8月20日成立,基金代码为110022(前端),易方达基金成立于2001年,通过市场化、专业化的运作,依托于资本市场,为境内外客户提供资产管理解决方案,力求实现长期可持续的投资回报。截至2021年12月31日,公司总资产管理规模超2.7万亿元,是国内领先的综合型资产管理公司,客户包括个人投资者及社保基金、养老金、大型金融机构、境外央行等各类机构投资者。2、公司自成立以来始终专注于资产管理业务,基于“深度研究驱动、时间沉淀价值”的投资理念,在主动权益、指数、债券、另类资产等投资领域全面布局,多年来凭借规范的管理与持续稳定的业绩,为客户创造了良好的回报。公司恪守客户利益至上的原则,以“发现价值、创造未来”为使命,坚持规范、稳健、开放的经营理念,致力于打造“值得长期托付的世界级资产管理公司”。拓展资料投资者可以从以下几个方面着手: 1、基金的过往业绩 投资者了解基金以往的业绩是非常必要的,就如同观察考试成绩来判断一个学生的优秀程度一样,基金以往的表现从一定程度上说明了基金的盈利能力。虽然考试成绩不是最好的指标,但却是最现实可用的指标,对于基金来讲也是如此。需要注意的是,观察基金过往业绩的时候要与同类型的基金相比,否则“苹果和梨子”的比较是没有意义的,例如要将股票型基金和股票型基金相比,而不能把货币市场基金拿来与股票型基金比较。同时还需要注意的是,不要仅仅比较基金的回报率,我们更要关注基金在为我们赚钱的同时让我们承担了多大的风险。如果有两只基金的收益率比较接近,那么我们一般会去选择那只波动相对较小风险不大的基金。 2、基金的持仓结构 基金实质上是基金公司提供给投资者的理财服务,但这一服务是通过证券组合的形式表现出来的,因为基金也要买股票、债券。那么,我们通过基金的证券组合可以看到基金在投资风格上的很多特点,例如我们通过一些统计学上的方法,可以区分出一只基金它所持有的股票到底是大盘价值类股票居多呢,还是更加青睐小盘成长类股票。从证券组合的变动情况,可以看出基金在日常运作中的特点,例如仓位的轻重、持股的集中度以及资产的周转率等等,都可以反映出基金的投资风格。当然,更直接的方法,是把基金的十大重仓股列出来,一一加以评判,从这些股票的潜力来判断近期基金的表现。
2023-06-29 21:01:261

易方达消费行业鸿阳股和易方达中小盘混合哪个适合长期定投

易方达消费行业和易方达中小盘混合哪个适合长期定投?都是易方达旗下的明星基金,三年期的收益差别不大。都可以长期定投,因为定投也需要自己搞个组合的。建立基金组合主要是为了降低风险,没有任何投资产品是百分百正收益,没有任何风险的,单纯投资一支基金,很容易被黑天鹅绝杀,建立基金组合是为进一步降低基金的风险和波动,有些亏,有些赚,整体风险就会大大的降低。单独投资股票基金,资产过于单一,容易被黑天鹅绝杀。所以我们又进行了资产配置,进一步降低风险。根据获诺奖的资产组合理论:如果资产间相关性弱,那么同时持有它们,就可以降低整体的风险。比如股票和债券往往是跷跷板,股票好的时候债券不好,债券好的时候股票不好,那么同时持有股票和债券,投资的整体风险就会大大降低。具体来说,为了更好地控制风险,我们还分散持有房产,债券,银行存款,保险,未来还会分散持有海外资产,进一步分散风险。正常估值的指数基金,可以适当的定投一些,适合以定投为主,单笔投资为辅的投资策略。不过要定期检查自己的基金,看是不是被市场高估了。最重要的是,绝不能只选一只单独的基金定投,而是要做一个基金组合来做长期定投,现代的投资组合理论证明了当组合中的资产类别相关性不大时,在保持原有预期收益的情况下,风险将会大幅降低。
2023-06-29 21:01:356

有哪些表现优秀的消费类主动基金?

目前消费类的基金表现都不是特别好,买消费基金的话还是要多观望一段时间,因为现在A股一直处于下跌的状态,消费类的基金已经大跌了半年了。易方达消费行业股票基金,易方达中小盘混合,易方达蓝筹精选混合基金,中欧消费主题股票基金,景顺长城绩优成长基金这些消费类主动基金都是非常不错的。
2023-06-29 21:02:084

佩蒂股份新三板价格是多少?

佩蒂股份上市公司名称:佩蒂动物营养科技股份有限公司所属行业:食品&饮料 > 食品制造业投 资 方:非公开上市时间:2017年07月11日发 行 价:22。34RMB上市地点:深圳证券交易所创业板发 行 量:20000000股股票代码:300673
2023-06-29 21:00:311

佩蒂股份股价是多少?

佩蒂股份(300673)最高39。18最低37。00换手率2。42%成交量205。59万市盈率58。20总市值64。41亿
2023-06-29 21:00:221

易方达消费行业股票基金现在的估值是否偏高?可以坚持定投吗?

易方达消费行业的股票基金现在的估值是偏高的,而且目前的走势也不是特别的好,一直处于下跌的状态,现在是可以坚持定投的,这个基金未来肯定会涨起来的。
2023-06-29 20:59:594

易方达消费行业股票型基金有哪些

可以去基金网站搜索,通过搜索基金公司和行业分类查询。
2023-06-29 20:59:501

易方达消费行业股票型基金适合长期定投吗?

易方达消费行业基金是易方达基金管理有限公司旗下一只基金,属于股票型基金,其发行主体易方达基金管理有限公司,属于基金行业较为优秀的基金公司。基金定投适合于那些风险较高,流动性较强的基金,帮助起到分散风险的作用。基金定投门槛较低,且具有积少成多,平摊投资成本,降低整体风险等特点。温馨提示:以上信息仅供参考,不构成任何投资建议。基金有风险,投资需谨慎。应答时间:2021-10-18,最新业务变化请以平安银行官网公布为准。 [平安银行我知道]想要知道更多?快来看“平安银行我知道”吧~ https://b.pingan.com.cn/paim/iknow/index.html
2023-06-29 20:59:414

基金的名字有哪三步组成

基金的名字由公司名称+投资方向/基金特点+基金类型组成。基金的名字由公司名称+投资方向/基金特点+基金类型组成,比如易方达消费行业股票,易方达就是指易方达基金公司,消费行业指的是投资于消费行业这个方向,股票是指这只基金的类型是股票型基金,基金资产大部分投资于股票。
2023-06-29 20:59:341