业界新闻
联付宝pos机客服电话
2024-04-18 10:00:06
联付宝pos机人工客服电话:【点击查看客服电话】人工客服电话:【点击查看客服电话】工作时间是:上午9:00-晚上21:00。处理还款,协商还款,提前还款各方面问题等相关问题

AI圈公开(kai)的隐秘:天下模型一大(da)抄,OpenAI,锻炼,初创公司

抄袭已经成为AI世界公开(kai)的隐秘。

据The Information周一的文章(zhang),很多初创公司的AI聊天呆板人很大(da)概是采用了OpenAI和其(qi)他公司的数(shu)据开(kai)辟的。这些(xie)呆板人在某些(xie)任务上可以媲美GPT-4,但免费只是后者的一小部分。

初创公司在开(kai)辟历程当中没有披露利用OpenAI的技术。没有过,The Information报道称,OpenAI首席执(zhi)行官(guan)Sam Altman客(ke)岁夏天告(gao)诉(su)初创公司首创人,可以接受初创公司以这种方式利用OpenAI的技术。

虽然Altman的回(hui)应让一些(xie)初创公司松了一口气,但这种做法本色上损害了OpenAI的增进,Altman随时大(da)概转变(bian)主意。

在初创公司中,抄袭已成常态

初创公司抄袭OpenAI的详细(xi)做法是,先守旧GPT-4的会(hui)员,然后向它提出一系列问题,比方“这行代码(ma)有甚么问题?”他们利用这些(xie)问题和谜底来锻炼本身(shen)的竞品模型。

采用这一计谋(mou)的初创公司没有在少数(shu)。

Unsloth AI联合首创人Daniel Han估计,他大(da)约一半的客(ke)户从GPT-4或(huo)Anthropic的Claude模型中获取(qu)数(shu)据,并用它来革新本身(shen)的模型。很多公司也从ShareGPT得(de)到此类数(shu)据,ShareGPT是一个开(kai)辟人员分享(xiang)利用OpenAI模型生成谜底的网站。

小型开(kai)辟商的模型通常基于Meta Platforms或(huo)Mistral AI免费提供(gong)的流行开(kai)源模型,但通过融合OpenAI模型的谜底,可以显著(zhu)提高这些(xie)模型输(shu)入(ru)内容的质量。Han表示,一些(xie)开(kai)辟人员正在利用一项名为OpenPipe的办事(shi)来自动化这一历程。

“在一个尚未建立明确规则(ze)的重生态系统中,就会(hui)产生这种情况,”Menlo Ventures董事(shi)总经理(li)Matt Murphy表示,该公司投(tou)资了OpenAI的竞争(zheng)敌手Anthropic。Murphy说:

如果人人都利用相反的数(shu)据,你怎样能(neng)比其(qi)他人更出色呢?

如果人人都利用相反的数(shu)据,你怎样能(neng)比其(qi)他人更出色呢?

现(xian)在尚没有清楚(chu)OpenAI、谷(gu)歌、Anthropic和其(qi)他大(da)型开(kai)辟商会(hui)在多大(da)水平上同意初创敌手利用他们的数(shu)据举行追赶。

Radical Ventures合伙人Rob Toews表示:

AI模型的锻炼数(shu)据的质量和来源正成为最(zui)重要的热点问题之一。没有人切实知道事(shi)变(bian)将怎样进展,但任何没有对(数(shu)据来源)举行严密和战略考(kao)虑的AI初创公司都在掉队。

AI模型的锻炼数(shu)据的质量和来源正成为最(zui)重要的热点问题之一。没有人切实知道事(shi)变(bian)将怎样进展,但任何没有对(数(shu)据来源)举行严密和战略考(kao)虑的AI初创公司都在掉队。

如果那些(xie)在开(kai)辟模型时黑暗(an)依赖其(qi)他AI办事(shi)的开(kai)辟商被暴(bao)光,它们大(da)概会(hui)面(mian)临难(nan)堪的处境。

好比,总部位于巴黎的Mistral利用Meta的开(kai)源AI 模型Llama 2建立了本身(shen)的AI,但直到无(wu)意保守才披露这一事(shi)实,引起了一些(xie)开(kai)辟者的没有满。Mistral已经筹集了数(shu)亿美元的资金。

大(da)公司也一样?

实际上,初创公司利用OpenAI数(shu)据锻炼模型的做法,与OpenAI等AI巨(ju)头的做法并无(wu)二致。

OpenAI首席技术官(guan)Mira Murati上个月在回(hui)覆有关该公司是否利用谷(gu)歌旗下YouTube和Meta Platforms旗下Facebook和Instagram的数(shu)据来锻炼生成AI视(shi)频的Sora时显示出了夷(yi)由(you)和狐疑。

如果OpenAI真的利用了这些(xie)数(shu)据,也没有足为奇。

据《纽约时报》近来的报道,OpenAI建立了一个名为Whisper的语音辨认(ren)工具(ju),用于转录YouTube视(shi)频,以此来革新GPT-4。此前,也有媒体曾报道称,OpenAI黑暗(an)利用YouTube数(shu)据锻炼其(qi)初期(qi)的AI模型。

就在本月早些(xie)时候,YouTube CEO Neal Mohan还表示,他没有赞成OpenAI利用YouTube视(shi)频来开(kai)辟像Sora这样的文生视(shi)频模型。

这种行为也致使OpenAI招致了侵权官(guan)司。《纽约时报》公司客(ke)岁12月起诉(su)OpenAI及其(qi)最(zui)大(da)支(zhi)撑者微软(ruan),指控他们在锻炼模型时非(fei)法复制了该报的旧事(shi)文章(zhang)。诉(su)讼称,OpenAI的聊天呆板人“可以逐字逐句地(di)生成时报内容”。

作(zuo)为回(hui)应,OpenAI辩称,它已积极与旧事(shi)出版商建立互助关系,其(qi)锻炼做法属于美国版权准绳“公道利用”所(suo)同意的局限。

尽(jin)管如此,OpenAI和谷(gu)歌都与Axel Springer等出版商达成了数(shu)百万美元的许可协定,并与Reddit等首要网站达成了更大(da)的交(jiao)易。

纵然是科技巨(ju)头也难(nan)以抗拒捷径的诱惑。

The Information报道称,谷(gu)歌曾转录YouTube视(shi)频,Meta雇佣承包商总结(jie)受版权珍爱(ai)的书籍,Adobe利用Midjourney的AI生成照片(pian),均是为了锻炼自家AI模型。一名谷(gu)歌工程师因(yin)担忧公司利用OpenAI的ChatGPT数(shu)据而辞职。

初创公司Lamini的CEO Sharon Zhou表示,AI开(kai)辟的快速步伐和猛烈竞争(zheng)迫使开(kai)辟者求(qiu)助于有争(zheng)议的锻炼数(shu)据来源,如受版权珍爱(ai)的内容或(huo)LLM。

Zhou说:

在这个范畴,投(tou)资者需(xu)要看到异常快的进展。

在这个范畴,投(tou)资者需(xu)要看到异常快的进展。

*免责声明:文章(zhang)内容仅(jin)供(gong)参考(kao),没有构成投(tou)资建议

*风险提醒(xing):股市有风险,入(ru)市需(xu)审慎

? ? ? ? ? ? ? ? ?