🍀 Spring Date with Fortune, Prizes with Raffle! Growth Value Phase 1️⃣ 7️⃣ Spring Raffle Carnival Begins!
Seize Spring's Good Luck! 👉 https://www.gate.com/activities/pointprize?now_period=17
🌟 How to Participate?
1️⃣ Enter [Square] personal homepage, click the points icon next to your avatar to enter [Community Center]
2️⃣ Complete Square or Hot Chat tasks such as posting, commenting, liking, speaking to earn growth value
🎁 Every 300 points can raffle once, 10g gold bars, Gate Red Bull gift box, VIP experience card and more prizes waiting for you to win!
Details 👉 https://www.gate.com/ann
AI 助手的終極形態?為什麼投資人給這個「偷看你屏幕」的 AI 產品投了 1100 萬美元?
撰文:Leo
你有没有發現,現在的 AI 助手其實都挺"笨"的?每次打開 ChatGPT 或 Claude,你都得把背景重新解釋一遍。“我在做一個專案,關於…”,“我們團隊剛開了個會,討論了…”,“上週我發了封郵件,內容是…”。你花了五分鐘寫提示詞,才能得到一個勉強有用的回答。這不對勁。AI 不是應該讓工作變簡單嗎?為什麼反而增加了我們的工作量?
我最近體驗了一個叫Littlebird的產品,它剛剛完成了1100萬美元的種子輪融資,由Lotus Studio領投。這個產品讓我重新思考了一個問題:AI 助手到底應該是什麼樣子?它不應該是一個需要你不斷"投喂"資訊的工具,而應該是已經了解你工作和生活的助手。就像一個真正的助理,不需要你每次都從頭解釋專案背景、團隊情況和工作進度。
Littlebird的創始人Alexander Green在宣布融資時說了一句話,我覺得特別準確:"使用電腦的感覺越來越像是一種對抗。“每次打開電腦,我們都會感受到多巴胺和恐懼的雙重刺激。電腦本應該是"思維的自行車”,但網路的商業模式把一切都重新連結了:如果產品免費,那你就是產品;如果你是產品,目標就是收割你的注意力。自行車開始反過來蹬我們。這個比喻太精準了。我們本應該控制工具,但現在工具在控制我們。
為什麼 AI 助手總是"健忘"
我用了大半年各種 AI 工具,從 ChatGPT 到 Claude,從 Notion AI 到各種專門的 AI 寫作助手。每個工具都很強大,但每個工具都有同一個問題:它們完全不知道我是谁,我在做什麼,我關心什麼。每次對話都像是第一次見面,我得重新介紹自己、解釋背景、提供上下文。
舉個具體例子。上週我在準備一個產品發布會,涉及多個部門協作。我和設計團隊開會討論視覺方案,和市場團隊開會敲定傳播策略,和技術團隊討論產品演示的技術細節。這些會議的筆記分散在不同地方:有的在Notion,有的在郵件,有的只是口頭討論。當我想用 AI 幫我整理一份完整的發布會方案時,我得做什麼?我得把所有這些資訊都複製貼上到 AI 工具裡,寫一個超長的提示詞,詳細說明每個會議的內容和決定。光是準備這個提示詞,我就花了二十分鐘。
更荒謬的是,第二天我想修改方案時,我得重新做一遍。因為 AI 不記得昨天的對話,或者即使記得,也不知道昨天下午我又和 CEO 討論了新的方向調整。這種體驗讓我覺得,AI 助手不是在幫我,而是在給我增加額外的工作負擔。我不僅要做原本的工作,還得花時間"教"AI理解我的工作。
Littlebird的創始團隊在思考這個問題時有一個關鍵洞察:AI 模型本身其實很強大,限制它們效用的不是模型能力,而是缺乏關於用戶的數據。大語言模型對你一無所知,這從根本上限制了它們的實用性。這個觀點聽起來簡單,但卻直指問題核心。我們一直在討論如何讓模型更聰明,卻忽略了一個更基本的問題:如何讓模型了解用戶。
現在市場上有很多 AI 工具試圖解決上下文問題。有的專注於搜尋你的文件,有的專注於會議記錄,有的專注於郵件整理。但這些工具都有一個共同限制:它們只能看到你主動給它們的資訊。你得把文件上傳到它們的平台,或者授權它們存取你的Gmail,或者在開會時打開它們的會議記錄功能。這仍然需要用戶做大量的設定和維護工作。而且更關鍵的是,這些工具看不到你工作的全貌。它們可能知道你的會議內容,但不知道會後你在Slack上的討論;它們可能知道你的郵件,但不知道你在瀏覽器裡研究了什麼競品資訊。
Littlebird的不同之處:螢幕閱讀技術
Littlebird採用了一個完全不同的方法,他們叫它"screenreading"(螢幕閱讀)。這個技術讓我想起了人類助理是怎麼工作的。一個真正優秀的助理不需要你事無巨細地告訴她發生了什麼,她會觀察你的工作,記住重要的事情,在需要的時候提醒你。Littlebird就是在做類似的事情。
具體來說,Littlebird是一個Mac桌面應用,它會持續讀取你螢幕上的所有文本內容。注意,是"讀取",不是"截圖"。這個區別非常重要。之前有一些類似的產品,比如Rewind(後來改名為Limitless並被Meta收購)和微軟的Recall,它們的做法是不断截圖保存你的螢幕。這種方法有幾個問題:資料量巨大,因為圖片檔案很大;隱私性差,因為截圖會捕捉所有視覺資訊;搜尋體驗不好,因為從圖片中提取資訊比從文本中提取要困難得多。
Littlebird的方法更聰明。它使用複雜的螢幕閱讀技術來理解所有應用中的文本內容,不需要任何繁瑣的設定。它能理解誰說了什麼、什麼時候說的,詳細追蹤你的專案進展。透過這種方式,它能建立起對你生活的豐富理解:誰對你重要、你在做什麼專案、你這周和今年關心什麼。創始人Green在接受訪談時說,這種方法讓資料輕量化很多,而且侵入性更低。
我特別欣賞這個設計的一點是,它尊重了軟體的本質。螢幕上顯示的內容本來就是文本和結構化資料,為什麼要把它轉換成圖片再轉回文本呢?直接讀取結構化內容不僅更高效,也更準確。而且從隱私角度看,文本資料比視覺資料敏感性要低得多。你的密碼可能顯示為星號,你的信用卡號可能被遮擋,但截圖會把這些視覺資訊都保存下來。
Littlebird會自動忽略密碼管理器和網頁表單中的敏感欄位,比如密碼和信用卡詳細資訊。你也可以自訂讓它忽略哪些應用。這給了用戶很大的控制權。如果你不希望Littlebird看到你在某個應用中的工作,比如私人聊天軟體或財務軟體,你可以輕鬆地將它們排除。
除了被動讀取螢幕內容,Littlebird還可以主動連結其他應用。你可以選擇連結Gmail、Google Calendar、Apple Calendar和Reminders等。這讓它能夠更全面地理解你的工作和生活。它不僅知道你螢幕上發生了什麼,還知道你的行程安排、待辦事項和郵件往來。
全上下文 AI 意味著什麼
當 AI 真正擁有了關於你的完整上下文,使用體驗會發生質的變化。我看到Littlebird提供的一些使用場景,讓我意識到這不只是漸進式改進,而是一種全新的互動模式。
最基本的功能是回答問題。但和其他 AI 工具不同,Littlebird的回答是基於對你工作的深入理解。你可以問"我今天都做了什麼?“或者"哪些郵件對我重要?”。在使用幾天後,這些預設的提示會變得越來越個人化。這很有趣,因為AI開始學習你關心什麼、你的工作模式是什麼。
創始人Green分享了他的使用體驗,我覺得特別能說明全上下文AI的價值。他每天都會問Littlebird"這周什麼是重要的"或者"我應該專注於什麼",經常會收到令人驚訝且深思熟慮的答案。他用它來獲取專業建議和指導,填補自己技術知識的空白,甚至用來規劃晚宴。這些使用場景跨度很大,但共同點是:AI能給出有洞察力的答案,因為它深入了解你的生活。
Littlebird內建了一個類似Granola的會議記錄功能,使用系統音訊在背景運行,捕捉會議轉錄並根據內容建立筆記和行動項。這本身不算新奇,市面上有很多會議記錄工具。但Littlebird的獨特之處在於,它能夠連結會議與你其他工作的上下文。
我最感興趣的是"Prep for meeting"(會議準備)功能。當你打開一個會議的詳細視圖時,有一個選項可以讓Littlebird為你準備這個會議。它會考慮過往會議的上下文、相關郵件和公司歷史,為你提供更多細節。這個功能甚至會從Reddit等來源取得資訊,告訴你用戶對特定產品或公司的看法。想像一下,你要和一個客戶開會,Littlebird會自動整理出:你們上次討論了什麼、這段時間有什麼郵件往來、這個客戶的公司最近有什麼動態、用戶對他們產品的反饋是什麼。這就像有一個真正優秀的助理在幫你做會前準備。
還有一個叫Routines(例行程序)的功能讓我覺得很實用。它允許你建立詳細的提示,讓Littlebird按固定間隔運行,比如每天、每週或每月。公司列出了一些現成的例行程序,像每日簡報、每週活動總結、昨日工作總結。用戶也可以建立自己的例行程序,配合自訂指令。我覺得這個功能解決了一個很實際的問題:我們都知道應該定期回顧和總結工作,但很少有人能堅持做。有了Routines,AI會主動幫你做這件事。
Littlebird團隊進行的內部調查顯示了這種全上下文AI的實際價值:84%的用戶報告每週至少節省半天時間,80%的用戶表示產品減少了他們日常工作的焦慮。這兩個數據都很有意思。節省時間容易理解,因為你不需要花時間整理資訊、尋找文件、回憶細節。但減少焦慮這個效果,我覺得更深刻。很多工作焦慮來自於擔心遺漏重要資訊、忘記重要事項、無法及時回應。當你知道有一個AI在幫你追蹤所有這些,焦慮自然會減輕。
隱私與控制的平衡
當我了解到Littlebird能持續讀取螢幕上的所有內容時,我的第一反應是:這安全嗎?會不會洩露我的隱私?這種擔憂完全合理。如果一個應用要觀察你的整個數位工作日,信任就是一切。
Littlebird的設計理念是"預設私密、安全和用戶可控"。從技術角度看,他們做了幾件事來保障隱私。所有資料使用AES-256加密存儲,傳輸使用TLS 1.3。用戶資料永遠不會被用來訓練AI模型。這些是基本的安全措施,但對於這種產品來說非常關鍵。
更重要的是用戶控制權。你可以隨時暫停資料收集,可以排除特定應用或網站,可以一鍵刪除任何資料。這種設計讓用戶始終掌控自己的資訊。如果你要處理特別敏感的內容,可以暫時停止Littlebird;如果某些應用永遠不想被監控,可以將它們加入黑名單。
Green在訪談中解釋了為什麼選擇雲端存儲而非本地存儲。原因是要運行強大的模型來處理不同的AI工作流程,這在本地是無法實現的。這是一個有趣的權衡。本地存儲顯然更安全,因為資料不會離開你的裝置。但雲端存儲能使用更強大的AI模型,提供更好的功能。Littlebird選擇了後者,但透過強化加密和嚴格的隱私政策來彌補安全風險。
我注意到Littlebird取得了SOC 2認證,完全符合GDPR和CCPA規範。這些認證和合規不是小事,尤其是對一個新創公司來說。這表明團隊從一開始就把安全和隱私當作核心要求,而不是事後補充。
還有一個細節我覺得很重要:Littlebird不存儲任何視覺資訊,只存儲文本。這讓資料輕量化很多,也大大降低了侵入性。Green說這可能是Recall和Rewind遇到困難的原因之一,截圖的資料量太大了。而且截圖確實更侵入性。想像一下,你在瀏覽一些個人照片或者在看一些影片內容,截圖會把所有這些視覺細節都保存下來。但文本記錄只會記錄描述性的內容,不會保存圖像本身。
這種設計讓我想起了一個更宏觀的問題:我們到底希望AI了解我們到什麼程度?完全的透明可以帶來最大的便利,但也意味著最大的風險。Littlebird的方法是讓用戶自己決定這個邊界。你可以讓它看到一切,也可以嚴格限制它的存取範圍。這種彈性很重要,因為不同的人、不同的使用場景,對隱私的要求完全不同。
這對AI產品意味著什麼
Littlebird的故事讓我重新思考AI產品應該怎麼做。在我看來,這個產品體現了幾個重要的產品理念,值得所有AI產品開發者思考。
第一是上下文的重要性。Littlebird的投資人Lenny Rachitsky說了一句我特別認同的話:"AI的好壞取決於它擁有的上下文,而它對你的一天了解得太少了。"這句話點出了當前AI產品的核心問題。我們一直在優化模型、改進算法,但忽略了一個基本事實:再聰明的AI,如果不了解用戶的具體情況,也給不出真正有用的答案。
這讓我想起之前AI產品的一個誤區。很多團隊在構建複雜的RAG(檢索增強生成)系統,試圖讓AI能夠存取各種資料源。這個方向沒錯,但方法可能不對。與其讓用戶主動上傳文件、授權存取各種應用,為何不讓AI主動觀察用戶的工作呢?Littlebird的screenreading技術本質上是一種被動但全面的上下文收集方式,比主動但零散的連結更有效。
第二個是找到killer use case的重要性。Rachitsky在談到Littlebird的長期成功時說,關鍵是找到那個必不可少的使用場景。他說很多人已經為自己找到了這個場景,團隊正在關注這些新興的使用案例。這個觀點很實際。做AI產品的團隊經常陷入一個陷阱:試圖打造一個"萬用"的工具,結果什麼都做但什麼都不精。
Rachitsky還分享了一個有趣的產品開發理念:"你不會真正知道人們如何使用你的產品,直到你把它推出去。策略是盡早推出產品,看人們如何使用,然後加倍投入那些使用場景,而不是等到把所有東西都想清楚了再推出。"這和傳統軟體開發理念很不同。傳統開發強調計畫、設計、完善,然後發布。但AI產品更像是一個持續的實驗,因為AI的能力邊界是模糊的,使用者會發現你意想不到的使用方式。
從投資人的使用反饋可以看出,不同的人確實找到了非常不同的使用場景。DocSend的聯合創始人兼CEO Russ Heddleston說,他用這個工具重寫了公司的行銷網站,使用了來自會議、郵件、Notion等的上下文。Google和Facebook前產品負責人Gokul Rajaram說,這個產品消除了記憶、檢索和重新解釋自己工作的摩擦。Rachitsky說他會詢問工具如何提高生產力工作流程以及如何變得更快樂。
這些使用場景跨度很大,從寫行銷文案到個人生產力優化,但都基於同一個核心能力:AI對用戶的深入理解。這驗證了Littlebird的核心假設:當AI真正了解你的上下文時,它的應用場景會自然湧現,而不需要產品團隊事先規劃好所有功能。
第三個啟示是產品定位的微妙之處。Littlebird把自己定位為"安靜的電腦"的未來。這個表述很有詩意,但也很準確。現在大部分AI產品都在爭奪你的注意力,彈出通知、推送提醒、試圖讓你多用它們。但Littlebird的理念是在後台工作,只在你需要的時候出現。這種"安靜"的特性可能是全上下文AI的必然選擇。如果一個AI真的了解你,它就不需要不斷打斷你來取得資訊,而可以默默在後台學習和準備。
Littlebird目前的商業模式是免費使用,但高級功能需要每月20美元起的訂閱。這個定價我覺得挺合理的,考慮到它提供的價值。如果真的能每週節省半天時間,那麼每月20美元絕對是划算的投資。但我更好奇的是,隨著產品發展,商業模式會不會演變?比如企業版會是什麼樣子?團隊協作功能會如何實現?
我對未來的思考
體驗了Littlebird的概念後,我開始思考一個更大的問題:未來的AI助手應該是什麼樣子?
我覺得我們正在經歷從"工具型AI"到"伙伴型AI"的轉變。工具型AI就像現在的ChatGPT,你需要它的時候打開,用完就關掉,每次都是新的開始。伙伴型AI則像Littlebird這樣,始終在旁邊,了解你的工作和生活,能夠主動提供幫助。這不是能力的差異,而是關係的差異。
這種轉變會帶來一些有趣的變化。比如,我們可能不再需要那麼多專門的AI工具。現在有各種各樣的AI應用:寫作助手、程式碼助手、資料分析助手、會議助手。但如果有一個AI真正了解你的所有工作,它可能可以在不同場景中提供一致的幫助,而不需要在多個工具之間切換。
另一個變化是提示詞工程可能會變得不那麼重要。現在我們花很多時間學習如何寫好的提示詞,如何提供足夠的上下文,如何引導AI給出我們想要的答案。但如果AI已經有了足夠的上下文,我們可能只需要簡單表達意圖就夠了。就像和人類助理溝通,你不需要每次都詳細解釋背景,因為她已經知道了。
但這種全上下文AI也會帶來新的挑戰。一個是心理適應。當你知道有個AI在持續觀察你的工作時,即使你理性上知道它是安全的,情感上可能還是會感到不適。這種感覺類似於知道有個同事一直在看你的螢幕。我們需要時間來適應這種新的工作關係。
另一個挑戰是依賴性。當你習慣了AI幫你記住所有事情、整理所有資訊、準備所有會議,你自己的記憶力和組織能力會不會退化?這有點像GPS對方向感的影響。很多人現在完全依賴導航,自己找路的能力大大下降。AI助理會不會帶來類似的效果?
從產業角度看,我覺得Littlebird代表了一個新的產品類別的出現。不是會議記錄工具,不是文件搜尋工具,而是"全上下文AI助理"。這個類別的核心特徵是:持續觀察、全面理解、主動服務。我預測會有更多公司進入這個領域,競爭會圍繞幾個維度展開:誰的上下文收集更全面?誰的AI理解更準確?誰的隱私保護更可信?
Littlebird的1100萬美元融資只是開始。投資人陣容很有意思,包括了產品、設計和內容領域的知名人士。這些投資人不只是提供資金,他們本身就是重度用戶,能夠提供產品反饋和使用場景。這種投資人結構對一個需要不斷迭代和發現使用場景的AI產品來說,價值可能比純粹的資金更大。
我很期待看到Littlebird接下來的發展。它會不會擴展到Windows和其他平台?會不會推出企業版,讓整個團隊共享某些上下文?會不會開發出我們現在還想像不到的新功能?更重要的是,它能不能真正找到那個killer use case,讓人覺得"沒有它我無法工作"?
Green在宣布融資時說:"有可能構建一個真正理解你的AI嗎?我們相信可以,我們很想展示給你看。"這句話既是承諾,也是挑戰。Littlebird還在早期,還在進行中,是一個持續的研究項目。它不會總是正確捕捉每個細節,有時會錯過同事在休假,或者專案已經完成。但你會驚訝於它對你了解得有多深。
我相信全上下文AI是未來的方向。不是因為技術炫酷,而是因為這才是AI應該有的樣子。AI的承諾是讓我們更高效、更專注、更有創造力。但如果AI本身需要大量的人工作為維護和輸入,它就違背了這個承諾。只有當AI真正理解我們、適應我們,它才能真正成為"思維的自行車",幫助我們騎得更快更遠。