DeepSeek老板登上新聞聯播！參加總理座談會

節莞爾 2025-01-27 悅科技 62 次瀏覽 0個評論

專題：DeepSeek為何能震動全球AI圈

　　國產AI大模型領域，非常熱鬧！

　　1月20日下午，總理主持召開專家、企業家和教科文衛體等領域代表座談會。

　　此前，非常少露面的DeepSeek老板梁文鋒，受邀參加并發言。

　　中國AI界的傳奇大佬，真人比想象中還年輕啊，皮膚保養好，看著還以為是學生代表。

　　這是見證歷史性一刻，AI大佬上新聞聯播了。

　　在參加總理會議的同一天，DeepSeek在官微上，發布了DeepSeek-R1 發布，性能對標 OpenAI o1 正式版。

　　DeepSeek-R1 在后訓練階段大規模使用了強化學習技術，在僅有極少標注數據的情況下，極大提升了模型推理能力。

　　在數學、代碼、自然語言推理等任務上，性能比肩 OpenAI o1 正式版。

　　R1的32B和70B版本，性能遠遠超過了OpenAI的GPT-4o，并逼近 o1-mini。

　　現在，DeepSeek已經全面上線了 R1，大家可以直接體驗。

　　美國建筑設計工作室 Workshop-APD 的創始人Matthew Berman 表示：DeepSeek R1 擁有我所見過的最像人類的內心獨白。

　　現在本地運行的 14b DeepSeek R1 蒸餾模型，能夠把問題回答成這樣，咱還要啥自行車呢？

　　17歲考入浙大

　　30歲創辦幻方

　　如此厲害的DeepSeek大模型，背后并是不什么互聯網科技大廠，而是炒股的。

　　DeepSeek深度求索，來自金融領域的頭部量化：幻方量化。

　　梁文鋒是幻方量化的實際控制人，他在DeepSeek最終受益的股份比例超80%。

　　1985年，梁文鋒出生于廣東湛江，那里盛產生蠔。他本碩就讀于浙江大學，攻讀人工智能，年輕讀書時就篤定“AI定會改變世界”。

　　2008年，在浙大讀書期間，23歲的梁文鋒與同學一起組團隊開始積累市場行情數據、金融市場其他相關數據以及宏觀經濟等數據。

　　梁文鋒開始使用機器學習等技術，探索量化交易。

　　他的碩士畢業論文題目是《基于低成本PTZ攝像機的目標跟蹤算法研究》。

　　梁文鋒表示：自己是八十年代在廣東一個五線城市長大的。

我的父親是小學老師，九十年代，廣東賺錢機會很多，當時有不少家長到我家里來，基本就是家長覺得讀書沒用。

但現在回去看，觀念都變了。因為錢不好賺了，連開出租車的機會可能都沒了。一代人的時間就變了。

　　畢業后，梁文鋒沒去做程序員，而是下場做量化投資，成立幻方量化。

　　他主導的幻方量化在2016年首次上線AI策略，并于2017年實現投資策略全面AI化，成為量化投資領域的創新先鋒?。

　　幻方量化成立僅6年管理規模即曾達到千億，被稱為‘量化四大天王’之一。

　　也是國內唯一公開宣稱有擁有萬張英偉達A100顯卡的企業，其算力儲備量就算是在一眾互聯網公司科技公司里，也豪不遜色。

　　2023年，梁文鋒創立了深度求索（DeepSeek）。

　　有消息稱，DeepSeek團隊不招聘高級技術專業人員。

　　員工的工作年限約為3到5年，而那些擁有8年以上研發經驗的人還可能會被直接拒絕。因為他們害怕這樣的人包袱太重、缺乏創新的動力。

　　梁文鋒曾對36氪暗涌說：

　　“如果追求短期目標，找現成有經驗的人是對的。但如果看長遠，經驗就沒那么重要，基礎能力、創造性、熱愛等更重要。”

　　就像大家不可能猜到，做游戲顯卡的英偉達，最后會成為AI界最重要的公司。

　　大家也不可能猜到，中國AI大模型的希望，可能就在炒股的公司身上。

　　背靠幻方量化的DeepSeek還不差錢。

　　梁文鋒在2024年表示，短期內沒有融資計劃，面臨的問題從來不是錢，而是高端芯片被禁運。

　　不參與融資，也很少對外發聲，悶聲去做AI。

　　外界都覺得DeepSeek很神秘。

　　近期“雷軍千萬年薪挖95后天才AI少女”的熱門話題也間接地與梁文鋒有關，因為雷軍嘗試挖走的這位90后少女羅福莉，此前正是梁文鋒旗下深度求索（DeepSeek）團隊的研發成員。

　　2024年12月26日，DeepSeek發布了DeepSeek-V3，并且還公開了由梁文鋒、羅福莉等人撰寫的53頁論文《DeepSeek-V3 Technical Report》。

　　AI界拼多多

　　此前DeepSeek一直被冠以“AI界拼多多”。

　　它開啟了中國大模型價格戰。

　　2024年5月，DeepSeek發布的一款名為DeepSeek V2的開源模型，提供了史無前例的性價比：

推理成本被降到每百萬token僅 1塊錢，在當時約等于Llama3 70B的七分之一，GPT-4 Turbo的七十分之一。

　　隨后，字節、騰訊、百度、阿里、kimi等AI公司跟隨降價。

　　梁文鋒表示，自己不是有意成為一條鯰魚，只是不小心成了一條鯰魚。沒想到價格讓大家這么敏感。只是按照自己的步調來做事，然后核算成本定價。

　　這次新發布的DeepSeek-R1 API 價格，一樣給力。

　　DeepSeek-R1 API定價為：每百萬輸入 tokens 1 元（緩存命中）/ 4 元（緩存未命中），每百萬輸出 tokens 16 元。

　　對比OpenAI o1 的 API 定價：每百萬輸入 tokens 15 美元、每百萬輸出 tokens 60 美元。

　　每百萬輸出定價，大概僅為OpenAI的3.65%。

　　DeepSeek極高的性價比，簡直是AI大模型界的拼多多。

　　DeepSeek還繼續開源到底，放出了背后的研究論文。

　　DeepSeek-R1的推理能力蒸餾到較小的密集模型中，展示了較小模型也可以擁有強大的推理能力。

　　使用Qwen和Llama系列模型進行蒸餾，結果表明蒸餾后的模型在基準測試上表現優異，例如DeepSeek-R1-Distill-Qwen-14B在AIME 2024上的通過率為69.7%。

　　Deepseek不會閉源，他們認為先有一個強大的技術生態更重要。MIT 授權：自由提煉和商業化！

　　英偉達的高級研究科學家Jim Fan（范麟熙）對DeepSeek-R1的評價是：

　　我們生活在這樣一個時代：一家非美國公司正在讓 OpenAI 的初衷得以延續——真正開放、為所有人賦能的前沿研究。這毫無意義。最有趣的結果才是最有可能的。

　　DeepSeek-R1 不僅開源了一系列模型，還公開了所有訓練秘訣。它們可能是第一個展示 RL 飛輪重大、持續增長的 OSS 項目。

　　梁文鋒曾總結過，中國AI和美國AI的差距。

我們看到的是中國AI不可能永遠處在跟隨的位置。我們經常說中國AI和美國有一兩年差距，但真實的gap是原創和模仿之差。如果這個不改變，中國永遠只能是追隨者，所以有些探索也是逃不掉的。

　　真正的差距不是一年或兩年，而是原創和模仿之差。

　　轉自：財經會議圈

　　（轉自：中國地產基金百人會）

你可能想看：

韓國執政黨黨首前往國務總理官邸同總理韓德洙緊急會面

總理開年首次調研透露哪些信號？擴內需仍是重點，基建有望加速

為討薪，他暴打老板、他捅人捅己……生活越來越有“判”頭！

敘總理發表視頻講話：仍身處家中未離開敘利亞

據悉加拿大總理特魯多即將宣布辭去自由黨領袖一職

超越OpenAI o1! DeepSeek-R1升至全球風格控制類第一，“中國模型”震動華爾街

外媒：馮德萊恩尚未收到參加特朗普就職典禮邀請，正試圖在典禮前與其會面

敘利亞總理：未來將交給敘利亞人民挑選的政府

加拿大政壇陷入動蕩總理特魯多迫于壓力宣布辭去黨首

一夜間，DeepSeek在美國刷屏，股民們焦慮“這是在做空英偉達嗎？”

轉載請注明來自杭州城建集團_城市建設，本文標題：《DeepSeek老板登上新聞聯播！參加總理座談會》

節莞爾 33篇文章站點微博

每一天，每一秒，你所做的決定都會改變你的人生！

發表評論取消回復

評論列表（暫無評論，62人圍觀）參與討論

他趴在我两腿中间吸我,亚洲成A∧人片在线播放无码,亚洲精品无码av人在线观看国产,亚洲情综合五月天

admin_1990管理員

熱評文章

網站收藏

DeepSeek老板登上新聞聯播！參加總理座談會

發表評論取消回復

還沒有評論，來說兩句吧...

最新文章

猜你喜歡

相鄰內容

友情鏈接

文章目錄

他趴在我两腿中间吸我,亚洲成A∧人片在线播放无码,亚洲精品无码av人在线观看国产,亚洲情综合五月天

admin_1990管理員

熱評文章

網站收藏

DeepSeek老板登上新聞聯播！參加總理座談會

英偉達股價暴跌12%，引領美股科技股拋售，DeepSeek引發對AI芯片支出的質疑

美國12月建筑許可從148.3萬套下修至148.2萬套

A股曾經最貴的女董秘離職了

寧德時代與DHL集團簽約

Advantrade:這僅僅是特朗普上任的第一周

美國鋼鐵力挺新日鐵收購 堅決抵制Ancora入局

一致性評價怎么做？仿制藥是不是不如原研藥？這些可能跟你想的有些不一樣

特朗普：美國將很快變成“一個更大的國家”

發表評論取消回復

還沒有評論，來說兩句吧...

最新文章

猜你喜歡

相鄰內容

友情鏈接

文章目錄

美國鋼鐵力挺新日鐵收購堅決抵制Ancora入局