AI 助手的終極形態？為什麼投資人給這個「偷看你屏幕」的 AI 產品投了 1100 萬美元？

Question

撰文：Leo你有没有發現，現在的 AI 助手其實都挺"笨"的？每次打開 ChatGPT 或 Claude，你都得把背景重新解釋一遍。"我在做一個專案，關於......"，"我們團隊剛開了個會，討論了......"，"上週我發了封郵件，內容是......"。你花了五分鐘寫提示詞，才能得到一個勉強有用的回答。這不對勁。AI 不是應該讓工作變簡單嗎？為什麼反而增加了我們的工作量？我最近體驗了一個叫Littlebird的產品，它剛剛完成了1100萬美元的種子輪融資，由Lotus Studio領投。這個產品讓我重新思考了一個問題：AI 助手到底應該是什麼樣子？它不應該是一個需要你不斷"投喂"資訊的工具，而應該是已經了解你工作和生活的助手。就像一個真正的助理，不需要你每次都從頭解釋專案背景、團隊情況和工作進度。Littlebird的創始人Alexander Green在宣布融資時說了一句話，我覺得特別準確："使用電腦的感覺越來越像是一種對抗。"每次打開電腦，我們都會感受到多巴胺和恐懼的雙重刺激。電腦本應該是"思維的自行車"，但網路的商業模式把一切都重新連結了：如果產品免費，那你就是產品；如果你是產品，目標就是收割你的注意力。自行車開始反過來蹬我們。這個比喻太精準了。我們本應該控制工具，但現在工具在控制我們。為什麼 AI 助手總是"健忘"我用了大半年各種 AI 工具，從 ChatGPT 到 Claude，從 Notion AI 到各種專門的 AI 寫作助手。每個工具都很強大，但每個工具都有同一個問題：它們完全不知道我是谁，我在做什麼，我關心什麼。每次對話都像是第一次見面，我得重新介紹自己、解釋背景、提供上下文。舉個具體例子。上週我在準備一個產品發布會，涉及多個部門協作。我和設計團隊開會討論視覺方案，和市場團隊開會敲定傳播策略，和技術團隊討論產品演示的技術細節。這些會議的筆記分散在不同地方：有的在Notion，有的在郵件，有的只是口頭討論。當我想用 AI 幫我整理一份完整的發布會方案時，我得做什麼？我得把所有這些資訊都複製貼上到 AI 工具裡，寫一個超長的提示詞，詳細說明每個會議的內容和決定。光是準備這個提示詞，我就花了二十分鐘。更荒謬的是，第二天我想修改方案時，我得重新做一遍。因為 AI 不記得昨天的對話，或者即使記得，也不知道昨天下午我又和 CEO 討論了新的方向調整。這種體驗讓我覺得，AI 助手不是在幫我，而是在給我增加額外的工作負擔。我不僅要做原本的工作，還得花時間"教"AI理解我的工作。Littlebird的創始團隊在思考這個問題時有一個關鍵洞察：AI 模型本身其實很強大，限制它們效用的不是模型能力，而是缺乏關於用戶的數據。大語言模型對你一無所知，這從根本上限制了它們的實用性。這個觀點聽起來簡單，但卻直指問題核心。我們一直在討論如何讓模型更聰明，卻忽略了一個更基本的問題：如何讓模型了解用戶。現在市場上有很多 AI 工具試圖解決上下文問題。有的專注於搜尋你的文件，有的專注於會議記錄，有的專注於郵件整理。但這些工具都有一個共同限制：它們只能看到你主動給它們的資訊。你得把文件上傳到它們的平台，或者授權它們存取你的Gmail，或者在開會時打開它們的會議記錄功能。這仍然需要用戶做大量的設定和維護工作。而且更關鍵的是，這些工具看不到你工作的全貌。它們可能知道你的會議內容，但不知道會後你在Slack上的討論；它們可能知道你的郵件，但不知道你在瀏覽器裡研究了什麼競品資訊。Littlebird的不同之處：螢幕閱讀技術Littlebird採用了一個完全不同的方法，他們叫它"screenreading"（螢幕閱讀）。這個技術讓我想起了人類助理是怎麼工作的。一個真正優秀的助理不需要你事無巨細地告訴她發生了什麼，她會觀察你的工作，記住重要的事情，在需要的時候提醒你。Littlebird就是在做類似的事情。具體來說，Littlebird是一個Mac桌面應用，它會持續讀取你螢幕上的所有文本內容。注意，是"讀取"，不是"截圖"。這個區別非常重要。之前有一些類似的產品，比如Rewind（後來改名為Limitless並被Meta收購）和微軟的Recall，它們的做法是不断截圖保存你的螢幕。這種方法有幾個問題：資料量巨大，因為圖片檔案很大；隱私性差，因為截圖會捕捉所有視覺資訊；搜尋體驗不好，因為從圖片中提取資訊比從文本中提取要困難得多。Littlebird的方法更聰明。它使用複雜的螢幕閱讀技術來理解所有應用中的文本內容，不需要任何繁瑣的設定。它能理解誰說了什麼、什麼時候說的，詳細追蹤你的專案進展。透過這種方式，它能建立起對你生活的豐富理解：誰對你重要、你在做什麼專案、你這周和今年關心什麼。創始人Green在接受訪談時說，這種方法讓資料輕量化很多，而且侵入性更低。我特別欣賞這個設計的一點是，它尊重了軟體的本質。螢幕上顯示的內容本來就是文本和結構化資料，為什麼要把它轉換成圖片再轉回文本呢？直接讀取結構化內容不僅更高效，也更準確。而且從隱私角度看，文本資料比視覺資料敏感性要低得多。你的密碼可能顯示為星號，你的信用卡號可能被遮擋，但截圖會把這些視覺資訊都保存下來。Littlebird會自動忽略密碼管理器和網頁表單中的敏感欄位，比如密碼和信用卡詳細資訊。你也可以自訂讓它忽略哪些應用。這給了用戶很大的控制權。如果你不希望Littlebird看到你在某個應用中的工作，比如私人聊天軟體或財務軟體，你可以輕鬆地將它們排除。除了被動讀取螢幕內容，Littlebird還可以主動連結其他應用。你可以選擇連結Gmail、Google Calendar、Apple Calendar和Reminders等。這讓它能夠更全面地理解你的工作和生活。它不僅知道你螢幕上發生了什麼，還知道你的行程安排、待辦事項和郵件往來。全上下文 AI 意味著什麼當 AI 真正擁有了關於你的完整上下文，使用體驗會發生質的變化。我看到Littlebird提供的一些使用場景，讓我意識到這不只是漸進式改進，而是一種全新的互動模式。最基本的功能是回答問題。但和其他 AI 工具不同，Littlebird的回答是基於對你工作的深入理解。你可以問"我今天都做了什麼？"或者"哪些郵件對我重要？"。在使用幾天後，這些預設的提示會變得越來越個人化。這很有趣，因為AI開始學習你關心什麼、你的工作模式是什麼。創始人Green分享了他的使用體驗，我覺得特別能說明全上下文AI的價值。他每天都會問Littlebird"這周什麼是重要的"或者"我應該專注於什麼"，經常會收到令人驚訝且深思熟慮的答案。他用它來獲取專業建議和指導，填補自己技術知識的空白，甚至用來規劃晚宴。這些使用場景跨度很大，但共同點是：AI能給出有洞察力的答案，因為它深入了解你的生活。Littlebird內建了一個類似Granola的會議記錄功能，使用系統音訊在背景運行，捕捉會議轉錄並根據內容建立筆記和行動項。這本身不算新奇，市面上有很多會議記錄工具。但Littlebird的獨特之處在於，它能夠連結會議與你其他工作的上下文。我最感興趣的是"Prep for meeting"（會議準備）功能。當你打開一個會議的詳細視圖時，有一個選項可以讓Littlebird為你準備這個會議。它會考慮過往會議的上下文、相關郵件和公司歷史，為你提供更多細節。這個功能甚至會從Reddit等來源取得資訊，告訴你用戶對特定產品或公司的看法。想像一下，你要和一個客戶開會，Littlebird會自動整理出：你們上次討論了什麼、這段時間有什麼郵件往來、這個客戶的公司最近有什麼動態、用戶對他們產品的反饋是什麼。這就像有一個真正優秀的助理在幫你做會前準備。還有一個叫Routines（例行程序）的功能讓我覺得很實用。它允許你建立詳細的提示，讓Littlebird按固定間隔運行，比如每天、每週或每月。公司列出了一些現成的例行程序，像每日簡報、每週活動總結、昨日工作總結。用戶也可以建立自己的例行程序，配合自訂指令。我覺得這個功能解決了一個很實際的問題：我們都知道應該定期回顧和總結工作，但很少有人能堅持做。有了Routines，AI會主動幫你做這件事。Littlebird團隊進行的內部調查顯示了這種全上下文AI的實際價值：84%的用戶報告每週至少節省半天時間，80%的用戶表示產品減少了他們日常工作的焦慮。這兩個數據都很有意思。節省時間容易理解，因為你不需要花時間整理資訊、尋找文件、回憶細節。但減少焦慮這個效果，我覺得更深刻。很多工作焦慮來自於擔心遺漏重要資訊、忘記重要事項、無法及時回應。當你知道有一個AI在幫你追蹤所有這些，焦慮自然會減輕。隱私與控制的平衡當我了解到Littlebird能持續讀取螢幕上的所有內容時，我的第一反應是：這安全嗎？會不會洩露我的隱私？這種擔憂完全合理。如果一個應用要觀察你的整個數位工作日，信任就是一切。Littlebird的設計理念是"預設私密、安全和用戶可控"。從技術角度看，他們做了幾件事來保障隱私。所有資料使用AES-256加密存儲，傳輸使用TLS 1.3。用戶資料永遠不會被用來訓練AI模型。這些是基本的安全措施，但對於這種產品來說非常關鍵。更重要的是用戶控制權。你可以隨時暫停資料收集，可以排除特定應用或網站，可以一鍵刪除任何資料。這種設計讓用戶始終掌控自己的資訊。如果你要處理特別敏感的內容，可以暫時停止Littlebird；如果某些應用永遠不想被監控，可以將它們加入黑名單。Green在訪談中解釋了為什麼選擇雲端存儲而非本地存儲。原因是要運行強大的模型來處理不同的AI工作流程，這在本地是無法實現的。這是一個有趣的權衡。本地存儲顯然更安全，因為資料不會離開你的裝置。但雲端存儲能使用更強大的AI模型，提供更好的功能。Littlebird選擇了後者，但透過強化加密和嚴格的隱私政策來彌補安全風險。我注意到Littlebird取得了SOC 2認證，完全符合GDPR和CCPA規範。這些認證和合規不是小事，尤其是對一個新創公司來說。這表明團隊從一開始就把安全和隱私當作核心要求，而不是事後補充。還有一個細節我覺得很重要：Littlebird不存儲任何視覺資訊，只存儲文本。這讓資料輕量化很多，也大大降低了侵入性。Green說這可能是Recall和Rewind遇到困難的原因之一，截圖的資料量太大了。而且截圖確實更侵入性。想像一下，你在瀏覽一些個人照片或者在看一些影片內容，截圖會把所有這些視覺細節都保存下來。但文本記錄只會記錄描述性的內容，不會保存圖像本身。這種設計讓我想起了一個更宏觀的問題：我們到底希望AI了解我們到什麼程度？完全的透明可以帶來最大的便利，但也意味著最大的風險。Littlebird的方法是讓用戶自己決定這個邊界。你可以讓它看到一切，也可以嚴格限制它的存取範圍。這種彈性很重要，因為不同的人、不同的使用場景，對隱私的要求完全不同。這對AI產品意味著什麼Littlebird的故事讓我重新思考AI產品應該怎麼做。在我看來，這個產品體現了幾個重要的產品理念，值得所有AI產品開發者思考。第一是上下文的重要性。Littlebird的投資人Lenny Rachitsky說了一句我特別認同的話："AI的好壞取決於它擁有的上下文，而它對你的一天了解得太少了。"這句話點出了當前AI產品的核心問題。我們一直在優化模型、改進算法，但忽略了一個基本事實：再聰明的AI，如果不了解用戶的具體情況，也給不出真正有用的答案。這讓我想起之前AI產品的一個誤區。很多團隊在構建複雜的RAG（檢索增強生成）系統，試圖讓AI能夠存取各種資料源。這個方向沒錯，但方法可能不對。與其讓用戶主動上傳文件、授權存取各種應用，為何不讓AI主動觀察用戶的工作呢？Littlebird的screenreading技術本質上是一種被動但全面的上下文收集方式，比主動但零散的連結更有效。第二個是找到killer use case的重要性。Rachitsky在談到Littlebird的長期成功時說，關鍵是找到那個必不可少的使用場景。他說很多人已經為自己找到了這個場景，團隊正在關注這些新興的使用案例。這個觀點很實際。做AI產品的團隊經常陷入一個陷阱：試圖打造一個"萬用"的工具，結果什麼都做但什麼都不精。Rachitsky還分享了一個有趣的產品開發理念："你不會真正知道人們如何使用你的產品，直到你把它推出去。策略是盡早推出產品，看人們如何使用，然後加倍投入那些使用場景，而不是等到把所有東西都想清楚了再推出。"這和傳統軟體開發理念很不同。傳統開發強調計畫、設計、完善，然後發布。但AI產品更像是一個持續的實驗，因為AI的能力邊界是模糊的，使用者會發現你意想不到的使用方式。從投資人的使用反饋可以看出，不同的人確實找到了非常不同的使用場景。DocSend的聯合創始人兼CEO Russ Heddleston說，他用這個工具重寫了公司的行銷網站，使用了來自會議、郵件、Notion等的上下文。Google和Facebook前產品負責人Gokul Rajaram說，這個產品消除了記憶、檢索和重新解釋自己工作的摩擦。Rachitsky說他會詢問工具如何提高生產力工作流程以及如何變得更快樂。這些使用場景跨度很大，從寫行銷文案到個人生產力優化，但都基於同一個核心能力：AI對用戶的深入理解。這驗證了Littlebird的核心假設：當AI真正了解你的上下文時，它的應用場景會自然湧現，而不需要產品團隊事先規劃好所有功能。第三個啟示是產品定位的微妙之處。Littlebird把自己定位為"安靜的電腦"的未來。這個表述很有詩意，但也很準確。現在大部分AI產品都在爭奪你的注意力，彈出通知、推送提醒、試圖讓你多用它們。但Littlebird的理念是在後台工作，只在你需要的時候出現。這種"安靜"的特性可能是全上下文AI的必然選擇。如果一個AI真的了解你，它就不需要不斷打斷你來取得資訊，而可以默默在後台學習和準備。Littlebird目前的商業模式是免費使用，但高級功能需要每月20美元起的訂閱。這個定價我覺得挺合理的，考慮到它提供的價值。如果真的能每週節省半天時間，那麼每月20美元絕對是划算的投資。但我更好奇的是，隨著產品發展，商業模式會不會演變？比如企業版會是什麼樣子？團隊協作功能會如何實現？我對未來的思考體驗了Littlebird的概念後，我開始思考一個更大的問題：未來的AI助手應該是什麼樣子？我覺得我們正在經歷從"工具型AI"到"伙伴型AI"的轉變。工具型AI就像現在的ChatGPT，你需要它的時候打開，用完就關掉，每次都是新的開始。伙伴型AI則像Littlebird這樣，始終在旁邊，了解你的工作和生活，能夠主動提供幫助。這不是能力的差異，而是關係的差異。這種轉變會帶來一些有趣的變化。比如，我們可能不再需要那麼多專門的AI工具。現在有各種各樣的AI應用：寫作助手、程式碼助手、資料分析助手、會議助手。但如果有一個AI真正了解你的所有工作，它可能可以在不同場景中提供一致的幫助，而不需要在多個工具之間切換。另一個變化是提示詞工程可能會變得不那麼重要。現在我們花很多時間學習如何寫好的提示詞，如何提供足夠的上下文，如何引導AI給出我們想要的答案。但如果AI已經有了足夠的上下文，我們可能只需要簡單表達意圖就夠了。就像和人類助理溝通，你不需要每次都詳細解釋背景，因為她已經知道了。但這種全上下文AI也會帶來新的挑戰。一個是心理適應。當你知道有個AI在持續觀察你的工作時，即使你理性上知道它是安全的，情感上可能還是會感到不適。這種感覺類似於知道有個同事一直在看你的螢幕。我們需要時間來適應這種新的工作關係。另一個挑戰是依賴性。當你習慣了AI幫你記住所有事情、整理所有資訊、準備所有會議，你自己的記憶力和組織能力會不會退化？這有點像GPS對方向感的影響。很多人現在完全依賴導航，自己找路的能力大大下降。AI助理會不會帶來類似的效果？從產業角度看，我覺得Littlebird代表了一個新的產品類別的出現。不是會議記錄工具，不是文件搜尋工具，而是"全上下文AI助理"。這個類別的核心特徵是：持續觀察、全面理解、主動服務。我預測會有更多公司進入這個領域，競爭會圍繞幾個維度展開：誰的上下文收集更全面？誰的AI理解更準確？誰的隱私保護更可信？Littlebird的1100萬美元融資只是開始。投資人陣容很有意思，包括了產品、設計和內容領域的知名人士。這些投資人不只是提供資金，他們本身就是重度用戶，能夠提供產品反饋和使用場景。這種投資人結構對一個需要不斷迭代和發現使用場景的AI產品來說，價值可能比純粹的資金更大。我很期待看到Littlebird接下來的發展。它會不會擴展到Windows和其他平台？會不會推出企業版，讓整個團隊共享某些上下文？會不會開發出我們現在還想像不到的新功能？更重要的是，它能不能真正找到那個killer use case，讓人覺得"沒有它我無法工作"？Green在宣布融資時說："有可能構建一個真正理解你的AI嗎？我們相信可以，我們很想展示給你看。"這句話既是承諾，也是挑戰。Littlebird還在早期，還在進行中，是一個持續的研究項目。它不會總是正確捕捉每個細節，有時會錯過同事在休假，或者專案已經完成。但你會驚訝於它對你了解得有多深。我相信全上下文AI是未來的方向。不是因為技術炫酷，而是因為這才是AI應該有的樣子。AI的承諾是讓我們更高效、更專注、更有創造力。但如果AI本身需要大量的人工作為維護和輸入，它就違背了這個承諾。只有當AI真正理解我們、適應我們，它才能真正成為"思維的自行車"，幫助我們騎得更快更遠。

AI 助手的終極形態？為什麼投資人給這個「偷看你屏幕」的 AI 產品投了 1100 萬美元？

熱門話題

幣圈生存指南

貴金屬領漲

加密市場回漲

國際油價下跌

美國提出15項條件和談方案

熱門 Gate Fun

NIC

找回自我

57

CCTV57

57

CCTV57

Xtermux

知行合一

zie

zie

置頂