他趴在我两腿中间吸我,亚洲成A∧人片在线播放无码,亚洲精品无码av人在线观看国产,亚洲情综合五月天

DeepSeek老板登上新聞聯播!參加總理座談會

DeepSeek老板登上新聞聯播!參加總理座談會

節莞爾 2025-01-27 悅科技 62 次瀏覽 0個評論

專題:DeepSeek為何能震動全球AI圈

  國產AI大模型領域,非常熱鬧!

  1月20日下午,總理主持召開專家、企業家和教科文衛體等領域代表座談會。

  此前,非常少露面的DeepSeek老板梁文鋒,受邀參加并發言。

  中國AI界的傳奇大佬,真人比想象中還年輕啊,皮膚保養好,看著還以為是學生代表。

  這是見證歷史性一刻,AI大佬上新聞聯播了。

  在參加總理會議的同一天,DeepSeek在官微上,發布了DeepSeek-R1 發布,性能對標 OpenAI o1 正式版。

  DeepSeek-R1 在后訓練階段大規模使用了強化學習技術,在僅有極少標注數據的情況下,極大提升了模型推理能力。

  在數學、代碼、自然語言推理等任務上,性能比肩 OpenAI o1 正式版。

  R1的32B和70B版本,性能遠遠超過了OpenAI的GPT-4o,并逼近 o1-mini。

  現在,DeepSeek已經全面上線了 R1,大家可以直接體驗。

  美國建筑設計工作室 Workshop-APD 的創始人Matthew Berman 表示:DeepSeek R1 擁有我所見過的最像人類的內心獨白。

  現在本地運行的 14b DeepSeek R1 蒸餾模型,能夠把問題回答成這樣,咱還要啥自行車呢?

  17歲考入浙大

  30歲創辦幻方

  如此厲害的DeepSeek大模型,背后并是不什么互聯網科技大廠,而是炒股的。

  DeepSeek深度求索,來自金融領域的頭部量化:幻方量化。

  梁文鋒是幻方量化的實際控制人,他在DeepSeek最終受益的股份比例超80%。

  1985年,梁文鋒出生于廣東湛江,那里盛產生蠔。他本碩就讀于浙江大學,攻讀人工智能,年輕讀書時就篤定“AI定會改變世界”。

  2008年,在浙大讀書期間,23歲的梁文鋒與同學一起組團隊開始積累市場行情數據、金融市場其他相關數據以及宏觀經濟等數據。

  梁文鋒開始使用機器學習等技術,探索量化交易。

  他的碩士畢業論文題目是《基于低成本PTZ攝像機的目標跟蹤算法研究》。

  梁文鋒表示:自己是八十年代在廣東一個五線城市長大的。

我的父親是小學老師,九十年代,廣東賺錢機會很多,當時有不少家長到我家里來,基本就是家長覺得讀書沒用。

但現在回去看,觀念都變了。因為錢不好賺了,連開出租車的機會可能都沒了。一代人的時間就變了。

  畢業后,梁文鋒沒去做程序員,而是下場做量化投資,成立幻方量化。

  他主導的幻方量化在2016年首次上線AI策略,并于2017年實現投資策略全面AI化,成為量化投資領域的創新先鋒?。

  幻方量化成立僅6年管理規模即曾達到千億,被稱為‘量化四大天王’之一。

  也是國內唯一公開宣稱有擁有萬張英偉達A100顯卡的企業,其算力儲備量就算是在一眾互聯網公司科技公司里,也豪不遜色。

  2023年,梁文鋒創立了深度求索(DeepSeek)。

  有消息稱,DeepSeek團隊不招聘高級技術專業人員。

  員工的工作年限約為3到5年,而那些擁有8年以上研發經驗的人還可能會被直接拒絕。因為他們害怕這樣的人包袱太重、缺乏創新的動力。

  梁文鋒曾對36氪暗涌說:

  “如果追求短期目標,找現成有經驗的人是對的。但如果看長遠,經驗就沒那么重要,基礎能力、創造性、熱愛等更重要。”

  就像大家不可能猜到,做游戲顯卡的英偉達,最后會成為AI界最重要的公司。

  大家也不可能猜到,中國AI大模型的希望,可能就在炒股的公司身上。

  背靠幻方量化的DeepSeek還不差錢。

  梁文鋒在2024年表示,短期內沒有融資計劃,面臨的問題從來不是錢,而是高端芯片被禁運。

  不參與融資,也很少對外發聲,悶聲去做AI。

  外界都覺得DeepSeek很神秘。

  近期“雷軍千萬年薪挖95后天才AI少女”的熱門話題也間接地與梁文鋒有關,因為雷軍嘗試挖走的這位90后少女羅福莉,此前正是梁文鋒旗下深度求索(DeepSeek)團隊的研發成員。

  2024年12月26日,DeepSeek發布了DeepSeek-V3,并且還公開了由梁文鋒、羅福莉等人撰寫的53頁論文《DeepSeek-V3 Technical Report》。

  AI界拼多多

  此前DeepSeek一直被冠以“AI界拼多多”。

  它開啟了中國大模型價格戰。

  2024年5月,DeepSeek發布的一款名為DeepSeek V2的開源模型,提供了史無前例的性價比:

推理成本被降到每百萬token僅 1塊錢,在當時約等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。

  隨后,字節、騰訊、百度、阿里、kimi等AI公司跟隨降價。

  梁文鋒表示,自己不是有意成為一條鯰魚,只是不小心成了一條鯰魚。沒想到價格讓大家這么敏感。只是按照自己的步調來做事,然后核算成本定價。

  這次新發布的DeepSeek-R1 API 價格,一樣給力。

  DeepSeek-R1 API定價為:每百萬輸入 tokens 1 元(緩存命中)/ 4 元(緩存未命中),每百萬輸出 tokens 16 元。

  對比OpenAI o1 的 API 定價:每百萬輸入 tokens 15 美元、每百萬輸出 tokens 60 美元。

  每百萬輸出定價,大概僅為OpenAI的3.65%。

  DeepSeek極高的性價比,簡直是AI大模型界的拼多多。

  DeepSeek還繼續開源到底,放出了背后的研究論文。

  DeepSeek-R1的推理能力蒸餾到較小的密集模型中,展示了較小模型也可以擁有強大的推理能力。

  使用Qwen和Llama系列模型進行蒸餾,結果表明蒸餾后的模型在基準測試上表現優異,例如DeepSeek-R1-Distill-Qwen-14B在AIME 2024上的通過率為69.7%。

  Deepseek不會閉源,他們認為先有一個強大的技術生態更重要。MIT 授權:自由提煉和商業化!

  英偉達的高級研究科學家Jim Fan(范麟熙)對DeepSeek-R1的評價是:

  我們生活在這樣一個時代:一家非美國公司正在讓 OpenAI 的初衷得以延續——真正開放、為所有人賦能的前沿研究。這毫無意義。最有趣的結果才是最有可能的。

  DeepSeek-R1 不僅開源了一系列模型,還公開了所有訓練秘訣。它們可能是第一個展示 RL 飛輪重大、持續增長的 OSS 項目。

  梁文鋒曾總結過,中國AI和美國AI的差距。

我們看到的是中國AI不可能永遠處在跟隨的位置。我們經常說中國AI和美國有一兩年差距,但真實的gap是原創和模仿之差。如果這個不改變,中國永遠只能是追隨者,所以有些探索也是逃不掉的。

  真正的差距不是一年或兩年,而是原創和模仿之差。

  轉自:財經會議圈

  (轉自:中國地產基金百人會)

你可能想看:

轉載請注明來自杭州城建集團_城市建設,本文標題:《DeepSeek老板登上新聞聯播!參加總理座談會》

每一天,每一秒,你所做的決定都會改變你的人生!

發表評論

快捷回復:

評論列表 (暫無評論,62人圍觀)參與討論

還沒有評論,來說兩句吧...

Top
網站統計代碼
主站蜘蛛池模板: 孟连| 芷江| 马山县| 中卫市| 罗平县| 扎囊县| 文安县| 雅安市| 靖远县| 姜堰市| 南宫市| 凉山| 湖口县| 藁城市| 永安市| 沾化县| 临澧县| 普格县| 桑日县| 陇南市| 庆城县| 留坝县| 宝鸡市| 遂溪县| 凤翔县| 唐河县| 竹山县| 青州市| 莆田市| 钟山县| 桂平市| 开封市| 滁州市| 神池县| 恭城| 甘泉县| 岳西县| 尚志市| 太仆寺旗| 长春市| 天气|