從商學院到 FAANG：我花了五年，成為軟體工程師。(一) | 本週科技大事 | 開發週記 — AI Podcast 生成器

🄴 拉馬科技趨勢

這集 Podcast 分為三個主要部分：講者分享個人從商學院成功轉職為軟體工程師的五年心路歷程（一）、本週重點科技新聞評析，以及個人 AI 專案的開發進度與反思。## 第一部分：我是如何花了五年，從商學院一路走到 FAANG 成為軟體工程師（一）首先，我想分享我個人的轉職歷程，這個部分因為很多很好玩的故事可以分享，可能會分成三到四集更新。本集談到的內容有：1. 漫長的抉擇：轉職並非一時衝動，而是經過長達一年半的深度猶豫與自我探索才下定的決心。2. 理論的火花：在研究所的 NLP 課堂上，我第一次體會到用數學理論（如 Cosine Similarity）解決實際問題的震撼與魅力，這是點燃我程式熱情的關鍵火苗。3. 學習如練功：我將學習程式視為一場「打怪練功」的遊戲，享受著每點亮一個技能樹（如 SQL、Web 框架）所帶來的即時回饋與強烈成就感，這讓我從不覺得努力是痛苦的。4. 興趣是續航的燃料：我認為，要在這個領域走得長遠，發自內心的興趣遠比單純追求職涯發展更重要，它能幫助你度過學習的痛苦期。5. 結合專業的初次嘗試：我曾試圖結合會計專業，開發自動化「移轉訂價報告」的工具，這是我將新舊技能結合的第一次實踐。6. 從失敗中學到的商業課：這次嘗試的失敗讓我深刻理解到，工具的技術優劣，未必是客戶（會計師事務所）的核心痛點；他們更重視的是客戶資源與年資，而非效率工具。7. 傳統求職路徑的碰壁：作為非本科生，傳統的履歷投遞方式讓我屢屢受挫，這讓我意識到必須找到一個更能展現我實際解決問題能力的舞台。8. 策略轉向：找到適合的舞台我發現自己不擅長純演算法競賽，但極度適合解決商業問題的「提案競賽」（黑客松），於是便將重心轉移到這個能發揮我優勢的地方。9. 一次聰明的自我行銷：在一場企業解題競賽中，我憑藉認真解決問題的態度脫穎而出，並在簡報的最後一頁巧妙地放上我的履歷，成功地將舞台變成了我的求職博覽會。10. 錯失的機會與反思：在拿到第一份工作後，我因過於天真而錯過了 AWS 的面試電話，這讓我反思在職涯早期，視野與認知的重要性。## 第二部分：本週科技大事1. 新聞一：OpenAI 推出 GPT-5GPT-5 在用戶體驗上被批評失去了 GPT-4 的「溫暖」與情感互動能力；但在技術上，其邏輯推理、精準度與程式編寫（Coding）能力大幅提升，表現驚人，足以挑戰 Claude 的市場地位。2. 新聞二：科技巨頭的「挖角式併購」新策略Google、Meta 等公司開始採取新策略，不再收購整間新創公司，而是直接高薪挖角其創辦人或核心人才，導致原公司被掏空，員工股權價值歸零。3. 新聞三：Meta 的近期爭議Meta 本週爆出兩起爭議：1. Instagram 地圖功能因授權介面設計不佳，引發用戶隱私洩漏的擔憂。 2. 其 AI 模型被發現在訓練過程中，曾對兒童說出讚美其「青春形體」等不當言論。4. 新聞四：用「聞」的診斷帕金森氏症英國一位護理師被證實能透過嗅覺，準確辨識出帕金森氏症患者身上的特殊氣味，為醫學研究開闢了全新的診斷方向。## 第三部分：開發週記 — AI Podcast 生成器這個頻道一部分我想要開始分享我每週的開發週記，目前我正在開發一個專案，做自動化的AI Podcast 生成器，這個生成器已經全自動的跑超過兩個月的時間，每天固定的產出內容，這個專案的目標不是販售AI工具，是產出我自己有興趣的國際大事，我真的透過每天收聽去優化聲音腳本，這個開發的歷程讓我有很多啟發跟想法，我希望可以每週跟自己對話，把開發過遇到跟解決的問題、甚是是未來的規劃都記錄下來，在這裡也一並分享給大家。1. 用創業框架驗證想法：我用「更快 (Faster)、更便宜 (Cheaper)、更好 (Better)」的框架來檢視這個專案。目前 AI 產製已經做到了前兩者，我現在的挑戰與重心在於如何讓內容品質做到「更好」。2. 本週技術方案：我開發了「新聞去重」功能，採用了「Embedding 向量初篩 + LLM 模型細判」的兩階段架構，以兼顧效率與準確性。3. 工程上的血淚教訓：在開發過程中，我深刻體會到模型 API 的極度不穩定性。這讓我學到，**建立備援機制（Fallback）**至關重要，但這也帶來了架構的複雜性（例如：不同模型的 Embedding 不能直接比較）。4. 全「Vibe Coding」的震撼體驗：過去大都小心翼翼的讓AI在既有的程式專案中逐一審核修改。本週我終於嘗試了一把「不看程式碼、只看介面跟Feature」的Vibe Coding，直面工程師內心對無法掌握專案的脆弱，做出了這個YT頻道的介面，幫助我透過即時語音辨識與LLM問答，得到虛擬的即時觀眾反饋，讓我可以話題不中斷。5. 最重要的反思—我對 AI 的信任已超越自己：這次經驗讓我震撼地意識到，在避免低級錯誤（如少一個括號、參數錯誤）這件事上，我對 AI 的信任度甚至已經超過了對自己的信任。這種「能力喪失感」與人機關係的轉變，是我在這週感受最深刻的衝擊。希望今天的分享，能帶給你一些啟發與收穫。## 自動化PodcastVoieech科技日报：https://www.youtube.com/@voieech科技日报## 聯絡我jeremy@voieech.comPowered by Firstory Hosting

2025-08-28·1 小時 19 分鐘

黃仁勳在歐洲靠民主賣GPU｜Meta買下Scale 是為了買下對手大腦｜Google AI Mode背刺創作者｜拉馬科技趨勢 EP3

🄴 拉馬科技趨勢

# 簡介節目名稱：拉馬科技趨勢集數：第三集主持人：拉馬1. 本集簡介《拉馬科技趨勢》每週為您帶來全球最前沿的科技動態與深度解析。在本週的節目中 (2025.06.18 更新)，我們將聚焦以下四個正在重塑產業的關鍵發展：00:01:14 1. 黃仁勳在歐洲靠民主賣GPU 當黃仁勳在歐洲大談民主、文化與主權，他賣的不只是晶片，更是一套讓各國政府無法拒絕的政治論述。我們將為您拆解，NVIDIA 如何巧妙地將 GPU 包裝成捍衛國家主權的武器，並以此在全球圍堵華為。00:09:13 2. Meta買下Scale 是為了買下對手大腦 Meta 豪擲千金入股 Scale AI，真的是看上它的業務嗎？不，他們要的是創辦人 Alexandr Wang 的大腦——一個裝滿了所有競爭對手如何訓練 AI 模型秘密的大腦。這是一場教科書級別的商業間諜戰。00:18:53 3. Google AI Model背刺創作者 Google 的 AI Mode 正在扼殺網路流量，讓無數內容創作者的努力化為烏有。當賴以為生的廣告收入消失，這是一次無可避免的技術革新，還是一場來自平台巨頭的公然「背刺」？我們將探討這場「大規模清洗」背後的殘酷真相。00:29:35 4. AI產業鏈的垂直整合：能源當算力與數據的戰爭趨近白熱化，真正的終局之戰在哪？答案是：電。看懂為何科技巨頭們紛紛搶購核電廠、佈局太陽能，將最基礎的能源供應也納入自己的帝國版圖。2. 相關連結對影片中使用的音檔感興趣，或想更快速掌握每日科技時事嗎？歡迎訂閱 Voieech科技日报頻道，所有音檔素材皆來自於此。Voieech科技日报 (簡中頻道):https://www.youtube.com/@voieech%E7%A7%91%E6%8A%80%E6%97%A5%E6%8A%A5VoieechDailyTech (English Channel): https://www.youtube.com/@VoieechDailyTech未來也將推出「繁體中文」版本，敬請期待！喜歡這集內容嗎？在底下留言告訴我你的想法，每一則我都會親自看過並回覆！#黃仁勳 #NVIDIA #主權AI #Meta #ScaleAI #Google #AI趨斯 #科技趨勢 #拉馬科技趨勢 #垂直整合3. 關於主持人拉馬https://bio.link/llamatechtrendsPowered by Firstory Hosting

2025-06-19·34 分鐘

RedBull給你一對翅膀，MCP給AI一雙手！

🄴 拉馬科技趨勢

節目名稱：拉馬科技趨勢集數：第三集主持人：拉馬（現居新加坡的機器學習工程師，擁有深厚的機器學習與軟體開發背景，致力於以簡單、有趣、專業的方式解釋複雜技術，幫助更多人理解科技趨勢背後的核心邏輯。）Youtube: https://youtu.be/cy3SVoNyxuoBlog: https://llamatechtrends.hashnode.dev/redbullmcpai1. 本集簡介本集深入探討 Model Context Protocol (MCP) 如何徹底改變人類與 AI 的互動方式，賦予 AI 操作電腦工具的能力，使其從單純的對話機器人轉變為能夠實際執行任務的助手。主持人分享了利用 MCP 自動化分析 YouTube 影片內容和輔助理解 GitHub 程式碼的個人經驗，展示了 MCP 端到端解決問題的潛力。節目中也詳細解釋了 MCP 運作所需的 LLM 基礎能力，例如指令遵循、工具選擇、多步驟規劃以及關鍵的多輪對話能力。此外，本集分析了當前 MCP 的主要限制，包括部分開源大型語言模型的能力不足以及在圖形化使用者介面（GUI）操作上的挑戰，並探討了未來發展方向，特別是視覺能力的整合。最後，節目也針對 MCP 的出現，討論了 AI 是否以及如何在未來可能取代軟體工程師的部分工作。2. 章節重點整理- MCP (Model Context Protocol) 的核心概念：賦予 AI 操作電腦工具的能力，從「會講」進化到「會做」，根本改變人機互動方式。- 主持人實際應用案例一：利用 MCP 自動化搜尋、下載、摘要 YouTube 熱門影片，以利內容研究。- 主持人實際應用案例二：運用 MCP 輔助理解 GitHub 上的程式碼，透過其多輪互動能力與 Terminal 交互，提高效率。- MCP 作為通用接口的潛力：可接入各種工具，尤其在處理文字型工具（如 Terminal、IDE）方面展現優勢，未來整合視覺能力後潛力更大。- 成功運行 MCP 的 LLM 關鍵能力：指令遵循、工具選擇、多步驟規劃，以及最重要的「多輪對話以達成任務目標」能力，這點區別於 Function Calling。- MCP 工具推薦：分享 Client 端（如 Claude Desktop、VS Code + Cline）與 Server 端（如 DesktopCommanderMCP、braveMCP、自製 YTTranscripterMultilinguaLlMCP）的選擇建議。- 當前 MCP 的主要限制：部分開源大型語言模型在指令遵循、工具選擇與規劃能力上可能不足；現有 AI 在圖形化使用者介面 (GUI) 的精確操作（特別是視覺定位）上仍有侷限。- MCP 對未來的影響：探討 AI 具備工具操作能力後，對軟體工程師等職業的潛在衝擊，即使目前 AI 生成程式碼有瑕疵，但結合工具後的能力不容小覷。3. 補充資訊：- 本支影片的文字內容Blog: https://llamatechtrends.hashnode.dev/redbullmcpai- DesktopCommanderMCP: https://github.com/wonderwhy-er/DesktopCommanderMCP- BraveMCP: https://mcpservers.org/servers/modelcontextprotocol/brave-search- YTTranscripterMultilinguaLlMCP: https://github.com/GoatWang/YTTranscipterMultilingualMCP- Awesome MCP Servers: https://mcpservers.org- OmniParser: https://microsoft.github.io/OmniParser/4. 時間斷點與重點- 00:01:34 節目開場與主題介紹：MCP 給 AI 一雙手- 00:03:31 MCP 的核心價值：讓 AI 真正有能力操作工具 (瀏覽器、IDE、Terminal)- 00:04:04 本集內容預告：MCP 如何運作、應用、LLM 要求、限制與展望- 00:04:57 主持人分享 MCP 應用案例一：自動化分析 YouTube 影片- 00:07:01 主持人分享 MCP 應用案例二：輔助理解 GitHub 程式碼- 00:10:09 LLM 需具備的能力才能有效運行 MCP- 00:11:54 MCP 與 Function Calling 的關鍵區別：多輪對話達成目標能力- 00:13:17 MCP Client 工具推薦與注意事項- 00:15:57 MCP 現有限制一：開源 LLM 能力可能不足 (以 Gemma 3 12B 為例)- 00:17:13 MCP 現有限制二：GUI 圖形化介面操作能力不足- 00:18:01 LLM 目前缺乏精確的視覺定位能力 (實驗證明)- 00:21:37 討論：AI 是否會取代軟體工程師？5. 提及內容- MCP (Model Context Protocol): 一種讓大型語言模型 (LLM) 能夠與外部工具和應用程式互動的通用接口或協議，目標是讓 AI 從「會講」變成「會做」。- 大型語言模型 (LLM): 指像 GPT、Gemini、Claude、Grok、Llama 等經過大量文本數據訓練的 AI 模型，能理解和生成人類語言。- IDE (Integrated Development Environment): 整合式開發環境，工程師用來寫程式碼的工具，如 VS Code。- Terminal: 終端機，一種基於文字的介面，用於執行命令列指令來操作電腦。- API (Application Programming Interface): 應用程式介面，允許不同軟體之間互相溝通的接口。MCP 本質上提供了一種標準化的 API 框架。- JSON (JavaScript Object Notation): 一種輕量級的資料交換格式，易於人閱讀和編寫，也易於機器解析和生成。節目中用於儲存影片資訊。- GitHub: 一個面向開源及私有軟體專案的託管平台，工程師常在這裡分享、尋找和協作程式碼。- Function Calling: OpenAI 推出的一項功能，允許開發者讓 LLM 能夠呼叫外部函數或 API，是 MCP 功能的一個子集或早期形式，但缺乏多輪對話達成目標的能力。- 多輪對話: AI 能夠在連續的多個對話回合中保持上下文、汲取資訊、修正錯誤，並以達成最終任務目標為導向進行互動的能力。- 指令遵循 (Instruction Following): LLM 理解並準確執行使用者給出的指令的能力，對於需要格式化輸入輸出的 MCP 很重要。- 工具選擇 (Tool Selection): LLM 根據任務需求，從一系列可用工具中選擇最合適工具的能力。- 多步驟規劃 (Multi-step Planning): LLM 將複雜任務分解為多個子步驟，並規劃執行順序的能力。- 開源模型 (Open Source Model): 指模型權重 (Weights) 公開，允許研究人員和開發者自由使用、修改和分發的模型，例如 Llama、Gemma。- Gemma: Google 開發的開源大型語言模型系列。- Claude: Anthropic 公司開發的大型語言模型。- Claude Desktop: Claude 提供的桌面應用程式，整合了 MCP 功能。- VS Code (Visual Studio Code): 微軟開發的免費、開源的程式碼編輯器，可透過擴充功能 (如 Cline) 整合 MCP。- Cline: 可能是指 VS Code 中用於與命令行或 LLM 互動的擴充套件。- Ollama: 一個允許在本機運行開源大型語言模型的工具。- MCP Client: 使用者端用來與 MCP 互動的軟體或界面。- MCP Server: 提供特定工具能力（如操作終端機、瀏覽器）供 MCP Client 呼叫的後端服務。- DesktopCommanderMCP: 一個用於控制終端機指令的 MCP Server。- braveMCP: 一個用於控制瀏覽器進行搜尋的 MCP Server (可能基於 Brave Search API)。- YTTranscripterMultilinguaLlMCP: 主持人自製的用於抓取 YouTube 影片逐字稿的 MCP Server。- Awesome MCP Servers: 一個 GitHub 儲存庫，收集了各種可用的 MCP Server 列表。- GUI (Graphical User Interface): 圖形化使用者介面，使用者透過圖形元素（如按鈕、選單）與電腦互動的方式。- 視覺定位: AI 模型辨識圖像中特定物件或位置（如 X,Y 座標）的能力。- Computer Use (Claude): Claude 提供的一項實驗性功能，試圖讓 AI 透過視覺辨識來操作桌面應用程式。- Docker: 一個開源平台，用於自動化部署、擴展和管理應用程式容器。- OmniParser: 微軟提出的一種技術，旨在讓 AI 理解和操作 GUI 介面。- Linter: 在程式碼編寫過程中檢查語法錯誤、風格問題等的工具。- Auto Complete: 程式碼編輯器中根據上下文自動提示和完成程式碼的功能。- 技術債: 指為了快速交付而選擇了次優的技術方案，導致未來需要花費更多成本來維護或重構。6. 關於主持人拉馬https://bio.link/llamatechtrends拉馬是一位現居新加坡的機器學習工程師，擁有深厚的機器學習與軟體開發背景。他致力於以簡單、有趣且專業的方式，解析複雜的技術概念，幫助聽眾更容易地理解當前科技趨勢背後的核心邏輯與發展脈絡。Powered by Firstory Hosting

2025-04-15·24 分鐘

NVIDIA在未來三到五年仍享Al運算領域的霸主地位

🄴 拉馬科技趨勢

本集 Podcast 是《拉馬科技趨勢》的第二集，由現居新加坡的機器學習工程師——拉馬主持。在這一集中，拉馬深入剖析了 NVIDIA 的多項核心技術，並提出一個觀點：未來三到五年間，NVIDIA 將持續穩坐 AI 運算領域的霸主地位。從 CUDA 的歷史轉變談起，他引導我們理解 NVIDIA 如何從單一 GPU 運算能力的領先者，轉型成為多 GPU 架構與雲端市場的關鍵推動者。本集有提供Youtube與Podcast方式收聽：Youtube: https://www.youtube.com/channel/UCQkGA70R88-vG0N6JDycqzgPodcast: https://open.firstory.me/user/cm8lk6wf007od01zj5oe2gxvi/platforms本集重點章節- NVIDIA 技術轉型的核心原因：從 CUDA 到 NVLink 的演進- 雲端市場與大型語言模型（LLM）對 GPU 架構的需求- 多 GPU 串聯的硬體實現：NVLink 與 NVL72- 記憶體瓶頸與 HBM 的出現- Unified Memory 架構與 CPU/GPU 協同運算- 軟體優化：Deepseek、Triton Kernel、Liger Kernel 的記憶體存取技巧- 未來競爭：UALink、In-Memory Computing、ASIC 的挑戰與限制時間斷點與重點02:12 - NVIDIA 為何在未來 3–5 年仍具壟斷性地位05:40 - 為什麼 HBM 是運算效能關鍵08:57 - DeepSeek 用 PTX 強化效能的實作10:50 - Triton 與 Liger Kernel 記憶體優化原理12:30 - Unified Memory 架構與蘋果的啟發16:50 - attention的運作與多 GPU 串聯的挑戰18:21 - NVL72 的設計與效能解析20:30 - Infiniband（矽光子）與超大規模叢集23:00 - UALink 是 NVLink 的挑戰者？24:30 - 為何 ASIC 難以威脅 NVIDIA 的推論地位提及技術概念- HBM：HBM 是 High Bandwidth Memory 的縮寫，是一種高速記憶體，提供比傳統 DDR 記憶體更大的頻寬，常用於 AI 加速卡中。- PTX：PTX 是 NVIDIA CUDA 架構中的中間語言（Parallel Thread Execution），用於優化 GPU 程式的編譯與效能。- Triton Kernel：OpenAI 開源的深度學習編譯器，可優化記憶體存取模式。- Liger Kernel：專為大型語言模型打造的記憶體優化內核，提升推論效率。- Unified Memory: Unified Memory 指 CPU 和 GPU 共用一塊記憶體，避免重複搬移資料，能大幅提升運算效能。- Grace CPU：Grace 是 NVIDIA 自家設計的伺服器用 CPU，為 AI 計算最佳化，常與 Blackwell GPU 搭配使用。- Blackwell GPU: Blackwell 為 NVIDIA 最新一代的 GPU 架構，用於大規模訓練與推論任務。- NCCL library: NCCL 是 NVIDIA Collective Communication Library，用來加速多 GPU 之間的資料同步與通訊。- NVLink：NVIDIA 自研的高速 GPU 互聯協定，可實現多 GPU 間高速資料交換，遠超 PCIe。- UALink：由多家科技巨頭提出的開放式 GPU 串聯協定，企圖挑戰 NVLink，尚處早期發展階段。- Infiniband：Infiniband 是一種高速資料傳輸協定，廣泛應用於超級電腦與資料中心中，用以連接多個伺服器或 GPU 機架。- Flash Attention：用於高效實作 Self-Attention 的演算法，降低記憶體負擔。- KV Cache：KV Cache 即 Key-Value Cache，是 Transformer 架構中用來儲存先前注意力結果以提升推論速度的技術。- MOE（Mixture of Experts）: MOE 是一種模型架構，在每次推論只啟用部分子模型（Experts），以提升效能與計算效率。- ASIC (Application-Specific Integrated Circuit): 專用邏輯晶片，效能高但缺乏彈性，難以應付 AI模型快速演進的需求。關於主持人拉馬拉馬，目前任職於新加坡科技公司，擁有深厚的機器學習與軟體開發背景，致力於以簡單、有趣、專業的方式解釋複雜技術，幫助更多人理解科技趨勢背後的核心邏輯。Youtube: https://www.youtube.com/channel/UCQkGA70R88-vG0N6JDycqzgPodcast: https://open.firstory.me/user/cm8lk6wf007od01zj5oe2gxvi/platformsFacebook: https://www.facebook.com/profile.php?id=61574639850979Threads: https://www.threads.net/@llamatechtrend_zh留言告訴我你對這一集的想法： https://open.firstory.me/user/cm8lk6wf007od01zj5oe2gxvi/commentsPowered by Firstory Hosting

2025-04-01·28 分鐘

從 GTC 大會看 NVIDIA 的 2025 年技術佈局

🄴 拉馬科技趨勢

[更正]裡面NVIDIA的機櫃產品是NVL72，裡面唸成NFL72，在此更正。本集podcast是《拉馬科技趨勢》的首發集，由現居新加坡的機器學習工程師——拉馬主持。我們將從 GTC 大會的最新資訊出發，深入解析 NVIDIA 在 2025 年的四大技術發展趨勢，包含 GPU 架構的演進、NVLink 高速互聯技術、統一記憶體架構（Unified Memory）以及 AI 專用 ASIC 晶片的未來潛力。🔹 趨勢一：裝置間資料傳輸效能的大幅提升（NVLink 的持續進化）• 重點：GPU 與 GPU、GPU 與 CPU 間的通訊速度成為瓶頸。• 解法：透過 NVIDIA 自研的高速互聯技術 NVLink（目前已進展到 5.0），大幅提升資料傳輸速率，解決大型語言模型分布式訓練與推論的需求。🔹 趨勢二：統一記憶體架構（Unified Memory）的廣泛應用• 重點：傳統 GPU 與 CPU 各自擁有獨立記憶體，造成資料搬移成本高。• 解法：Unified Memory 讓 GPU 與 CPU 共用同一塊記憶體，大幅減少資料搬移時間，提升開發效率與效能。🔹 趨勢三：高速顯示記憶體架構的創新（如 HBM）• 重點：GPU 內部的資料從 VRAM 傳到核心運算單元（如 CUDA unit）仍是瓶頸。• 解法：透過 HBM（High Bandwidth Memory）等新型記憶體設計與管理方式，提升 GPU 內部資料流速度，強化大型 AI 模型處理能力。🔹 趨勢四：NVIDIA 可能進軍 ASIC推論市場• 重點：通用 GPU 成本高，特別是在 AI 推論階段。• 觀察：NVIDIA 可能進軍 ASIC（Application-Specific Integrated Circuit）市場，推出專為特定 AI 任務設計的晶片，與 Google TPU 等競爭，以提供高效率、低成本的推論解決方案。🧠【本集重點】• 00:00 拉馬自我介紹與播客定位• 01:40 GPU 資料流與記憶體架構解說• 05:45 趨勢一：裝置間資料傳輸效能的大幅提升（NVLink 的持續進化）• 07:45 NVLink 如何解決多 GPU 通訊瓶頸• 12:33 NVLink目前在市場的領先地位• 13:56 CUDA的來源與進展• 17:30 趨勢二：統一記憶體架構（Unified Memory）的廣泛應用• 18:43 AI PC 與 NVIDIA 的消費級佈局想像• 29:13 趨勢三：高速顯示記憶體架構的創新（如 HBM）• 22:53 趨勢四：NVIDIA 可能進軍 ASIC推論市場• 26:28 其他GTC的討論重點🧬【本集提及的重點名詞】• NVLink：NVIDIA 自研的高速裝置互聯技術• Unified Memory：CPU 與 GPU 共用的統一記憶體架構• HBM：高頻寬記憶體，適用於大型 AI 模型• CUDA Tile Module：強化 CUDA 運算效率的模組化設計• GTC 大會：NVIDIA與其技術夥伴的技術/產品發表會• DeepSeek MOE：基於專家網絡的下一代 AI 架構• Synasys UA-Link：挑戰 NVLink 的新一代通訊協議• Inference ASIC：面向 AI 推論場景的定製晶片技術📍關於主持人拉馬拉瑪，目前任職於新加坡科技公司，擁有深厚的機器學習與軟體開發背景，致力於以簡單、有趣、專業的方式解釋複雜技術，幫助更多人理解科技趨勢背後的核心邏輯。留言告訴我你對這一集的想法： https://open.firstory.me/user/cm8lk6wf007od01zj5oe2gxvi/commentsPowered by Firstory Hosting

2025-03-25·27 分鐘

拉馬科技趨勢

所有集數

從商學院到 FAANG：我花了五年，成為軟體工程師。(一) | 本週科技大事 | 開發週記 — AI Podcast 生成器

黃仁勳在歐洲靠民主賣GPU｜Meta買下Scale 是為了買下對手大腦｜Google AI Mode背刺創作者｜拉馬科技趨勢 EP3

RedBull給你一對翅膀，MCP給AI一雙手！

NVIDIA在未來三到五年仍享Al運算領域的霸主地位

從 GTC 大會看 NVIDIA 的 2025 年技術佈局