【南投信義】丹大林道與消失的省道台16線|可徒步深入中央山脈的經典長程林道

圖片
布農族人有這麼一句話:「濁水溪的上游,不是終點,是我們布農文化的起源」,這句話揭開 丹大林道 的旅行序幕。下面是幾年前,丹大林道還沒被媒體大肆報導前,我曾在某個冬季前往安靜的丹大林道徒步健行和野營,以及在工寮過夜的三天兩夜重裝健行紀錄。 2024.01.31更新:合流坪的鋼便橋已於今日被台電撤除了 連結: 台電施工後丹大林道「恢復」通行! 拆橋挖巨溝「車輛恐無法通過」 丹大地區 位於臺灣本島中部之濁水溪上游,行政區隸屬於南投縣信義鄉,為全國面積第二大的鄉鎮。丹大地區也是濁水溪的發源處。東側翻過中央山脈可達花蓮,南鄰玉山國家公園,西接日月潭國家風景區,北側則與仁愛鄉相接。 潭南、雙龍、地利及人和四村等區域皆位於信義鄉,著名的 丹大(孫海)林道 便位於地利村中,沿著步道往東至花蓮邊界處可與七彩湖相接。其中地利村及雙龍村面積最大,合佔本區約七成面積,人和村次之,面積最小者為潭南村 。 丹大林道周邊地圖 丹大林道路徑示意圖 日治時期西元1943年,原本預計將東部花蓮木瓜溪流域附近的水力發電廠所生產的剩餘電力運輸到西部,但因為日本在1945年戰敗後,計畫就宣告中止,1948年台灣工業急速發展,用電量大增,直到1950年獲得美國援助執行了能高路線全長45公里的69kV東西向輸電計畫。 之後為了解決花東地區電力供應問題,台電於1985年開始研究新東西輸電之路線,最後決定自南投明潭發電廠與大觀第二發電廠輸送電力至花蓮鳳林超高壓變電所,此新東西輸電線於1990年開始辦理路線中心測量,1998年完工,全長72.4公里。 沿線共有196座電塔,線路橫跨中央山脈海拔2925公尺的崇山峻嶺,並在「 七彩湖 」附近的越嶺處設有「 光華復旦 」紀念碑,西以 丹大林道 、東以 萬榮林道 為維修保線道路。 丹大林道是深入丹大地區的重要通道,1958年(民國47年),出生於現今雲林縣口湖鄉的孫海,標得林務局巒丹大事業區第八林班地檜木原始林採伐權及伐木後的重新造林權,為了進入深林,孫海沿著原本的山徑開闢出可以卡車通行的丹大林道,因此丹大林道也被稱為「 孫海林道 」。 當年為了闢築林道與運輸需要,孫海建造了一座木橋於合流坪橫跨濁水溪,之後改為水泥橋,這座橋就是著名的「 孫海橋 」。 為了伐木業而開闢的丹大林道,其終點一開始並不是在七彩湖,後半段到光華復旦碑約12公里路段,是台電為了興建東西線輸電工程,才於

關於 Project Astra 和 Gemini AI 的一些隨想和實作

週末下雨沒爬山在家閒著,想起上個月 Google 在 2024 I/O 開發者大會上所展示的「Project Astra」示範影片(影片連結)。從影片中,可以看到 Astra 跟一般聊天機器人的視覺場景辨識不同, Astra 可以讓使用者在螢幕上畫上記號,並且讓 Gemini AI 根據記號來回答問題。

雖然這也不是啥了不起的技術,不過閒著沒事,便心血來潮,實作並實驗了一下影片中在手機螢幕上畫圖並讓 AI 識別的 Demo 的效果。

在官方 Demo 影片的0:16處,測試人員按下了手機 APP 中的藍色畫筆按鈕,我認為這個按鈕是用來在使用者送出語音提示後,用以區分當前應該為何種類型的多模態提示,因為在影片0:26處,測試人員示範完相機結合繪圖的辨識功能後,再次按下關閉繪圖的按鈕,我認為這個動作,目的是讓之後 Demo 內容中的多模態提示,都是以影格來作處理。

影片0:16處,使用者開啟了畫筆功能

之後測試人員向相機對著桌上的音響,在螢幕上畫了一個紅色箭頭,指向揚聲器頂部的圓圈,並問道「揚聲器的這個部分叫什麽?」Gemini 迅速回答道「那是高音單元。它負責產生高頻聲音。」

可以注意到,在影片中的0:21到0:25處,我們可以發現,測試人員在螢幕上畫了紅色箭頭後,將相機畫面保持在同一個地方,直到 AI 給出回答。

這是因為要將繪畫視圖和 CameraView 視圖作疊加處理,所以使用者的手機畫面,無法在畫了箭頭後,立即移動到別的地方。(因為他無法知道這個 prompt 是否已經成功送至後端的 Gemini AI,所以將畫面保持住,直到 AI 給出答案,是直覺且安全的方式。)

使用者在相機畫面上繪圖,並詢問 Gemini 箭頭指的是音響的什麼部件

影片0:26處,測試人員示範完螢幕上的繪圖辨識之後,關閉了畫筆功能

之後測試人員又持續使用相機畫面,來詢問 Gemini 一些問題, 首先測試人員移動到桌子另一端的蠟筆杯旁,並問道「給我一個關於這些蠟筆的創意疊詞」,Gemini 回答道「彩色蠟筆色彩繽紛。它們必能創造出色彩繽紛的作品。

隨後測試人員又 Demo 展示了 Project Astra 中的 Gemini 如何識別螢幕上的程式碼,還有根據窗外景色告訴使用者他所在的位置,以及記憶能力等功能。

最後當測試人員問到「你還記得眼鏡放在哪裡嗎?」,Gemini 依然能夠正確回答:「是的,我記得。你的眼鏡放在桌子旁邊,靠近一個紅色的蘋果。」(不過這些功能都是 Gemini 多模態模型本來就有的功能,所以並沒有讓我感到有多驚艷。)

在 Astra 找到眼鏡後,測試人員戴上眼鏡,影片畫面變成了可穿戴設備的視角。隨後就是一系列智能眼鏡搭配 Gemini AI 的應用展示(只不過這些展示,其實就是把手機應用搬到智能眼鏡上罷了,其實也沒多令人驚艷就是了。)

最後,Astra 幫老虎玩偶跟狗子取了一個「Golden Stripes」的二重奏樂隊名稱

以下是 Project Astra 的官方 Demo 影片


整個 Demo 內容中,讓我覺得最厲害的是,影片中,Astra 不僅持續在即時處理相機畫面中的視覺資料,還能記住它所看到的東西,並持續與後端的 Gemini AI 模型溝通。而且反應速度近乎即時,這幾點是整個 Project Astra 的 Demo 影片中,最令人感到神奇的部分。

DeepMind 的 Co-founder & CEO Demis Hassabis 表示,這是因為這些「虛擬專員」被設計來「透過連續編碼影格,將視訊和音訊輸入組合解譯成事件的時間線,並儲存此資訊以供高效調用。

Hassabis 還指出,「雖然我們在開發能夠理解多模態信息的 AI 系統方面取得了令人難以置信的進步,但將回應時間降低到對話水平,仍然是一項艱難的工程挑戰。」。Google 還一直在努力為其 AI 提供更寬廣的語音表達能力,使用其語音模型來「增強它們的發聲效果,為這些虛擬專員提供更廣泛的語調。」

Project Astra 的 Demo 影片中,我們可以知道,這個智能眼鏡,有一個或多個鏡頭、麥克風、光機,以及某種處理器,甚至是無線連線能力。

當然也不排除這只是 Google 為了 Project Astra 影片設計的效果,但整體來說這個眼鏡很像是 2015 年的 Google Glasses 重新復活,只是這次有了更明確的使用情境了。

目前,Project Astra 還處於早期測試階段,沒有具體的發布日期。然而,谷歌暗示其部分功能可能會在今年稍後整合到旗下的產品中,例如 Gemini 應用程式。它被稱為 Gemini Live,與 OpenAI 的 ChatGPT 上的對講功能沒有什麼不同。

Project Astra 只是今年 I/O 大會上眾多 Gemini AI 應用的一項。這次還發佈了一個新模型,名為 Gemini 1.5 Flash專為加快常見任務(如摘要和字幕)而設計。還有一個新的模型名為 Veo,可以從文本提示生成視頻。

此外,Gemini 1.5 Pro 的上下文窗口(即模型在給定查詢中可以考慮的信息量)已增加到 200 萬個 Token,並且 Google 表示該模型在遵循指令方面比以往任何時候都更好。

Gemini 1.5 Flash 的存在是為了讓 AI 助理更快


最後我實作了一個模仿 Project Astra 示範影片中的畫筆搭配相機畫面進行辨識的功能,來測試一下實際使用上是否真如官方 Demo 影片上的那般效果(結論是效果還可以!)


我讓 AI 把畫筆圈起來的英文「Stories From Taiwan's Mountains」翻譯為中文,提示中並沒有提的"圈起來",AI 可以從畫面和提示詞中自行理解我要翻譯封面上哪個部分的字詞

AI 給的答案是「來自台灣山區的故事」

然後我畫了個箭頭,詢問 AI「這看起來像是什麼季節?」,提示詞中同樣沒有提到紅色箭頭

AI 回答紅色箭頭所指的照片,裡面有秋天的楓紅,所以這是秋天

再讓它幫我把書本封面上的中文「不確定為什麼要去,正是出發的理由」,翻譯成英文

這個翻譯結果也是令人滿意的

然後我隨手畫了一個我也不知道是啥玩意兒的東西,詢問 AI 我畫的是什麼?

AI 的回答也是令人滿意的

再跟它瞎說一下,看看有什麼反應?

其實我畫的是不可描述之物

關於使用LLMs及真實資料來做多步驟任務推論

大型語言模型 (LLMs) 在理解和產生跨廣泛應用的類人文本方面取得了顯著的成功。他們掌握上下文並產生連貫、流暢的反應的能力已經改變了自然語言處理的許多領域。

然而,隨著任務複雜性的增加,常常難以在多個步驟中保持邏輯連貫性、事實準確性和穩健推理。這種限制是由於模型傾向於產生幻覺或產生與事實知識不一致的輸出,特別是在處理多步驟推理、長上下文或專門領域時。

為了解決這些問題並釋放LLM的全部潛力,研究人員一直在探索透過外部知識檢索和結構化推理過程來增強模型內在能力的技術。一種很有前景的方法是檢索增強思想(RAT)。 
檢索增強思維(Retrieval Augmented Thoughts, RAT)透過迭代修訂思維鏈來顯著提高大型語言模型(LLMs)在長期生成任務(代碼生成、數學推理、創意寫作和具身任務規劃等)中的推理和生成能力,同時大幅減輕幻覺現象。 RAT方法透過檢索與任務查詢、當前和過去思維步驟相關的資訊來逐一修訂每個思維步驟,從而在初始零次CoT(鍊式思維)生成後進行修訂。其中,兩種最常見的減少幻覺現象的技術是連鎖思維提示(Chain-Of-Thought, CoT)檢索增強生成(Retrieval Augmented Generation, RAG) 
透過 Gemini Pro API 和真實資料來進行多步驟推理任務的範例(1)

透過 Gemini Pro API 和真實資料來進行多步驟推理任務的範例(2)

透過 Gemini Pro API 和真實資料來進行多步驟推理任務的範例(3) 

 

前陣子看了一部老同學冠迪推薦的 AI 題材電影《異星戰境》(Atlas),故事講述在不久的將來,AI 仿生人已經進入人類生活的每個層面、成為不可或缺的夥伴之際,一位具有雙向連結功能的仿生人「哈蘭」突破「不可傷害人類」的安全協定,不知為何突然叛變,串聯眾多仿生人大肆屠戮,奪去大量的人類性命。

在取得叛軍下落後,軍方派出一支精銳小隊前往突襲,哪知卻正中叛軍下懷,反過來成了人類末日的最大威脅。故事情節和早期的電影《機械公敵》有點相似,也是把極度發展後具備自主意識的人工智慧,當成了左右人類生死的大敵。只不過這次還加入了環太平洋電影裡面的機器人元素。讓我想起這種人類和機器人合為一體的概念,最早好像在30年前的魔動王卡通裡面就出現過了。

電影中,有段女主角和人工智能的對話,令人印象深刻.

但人工智能從來沒活過
Bus an AI was never alive.

這就要看如何定義生命了
That depends on how you define life.

那些沒有生命的無機物呢?例如...人工智能
How about anything inorganic isn't alive? Such as artificial intelligence.

我對刺激有反應 我思考並能做出選擇 這不能代表我活著嗎?
I respond to stimuli. I think and I make choices. Does that not indicate I'm alive?

你是被設定為可以思考
You're programmed to think.

我們都是被設定的 你的DNA決定了你的想法、情緒、健康 和定義我的代碼是一樣的方式
We're all programmed. Your DNA dictates your thoughts, emotions, health in the same way that my code determines mine.

你覺得自己有靈魂嗎?
And do you think you have a soul?

我覺得萬物都有靈魂
I think everything has a soul.

但在你的代碼裡找不到
But you can't find it in your code.

和你一樣,你也找不到你的,但我相信它就在那裡
Not any more than you can find it in yours. But I have faith that it's there.



所以靈魂是什麼?意識從何而來?宇宙存在的目的又是什麼?人工智能有辦法回答這些問題嗎(笑)

熱門文章

[轉載] 洛克菲勒寫給兒子的38封信(全文)

【南投信義】丹大林道與消失的省道台16線|可徒步深入中央山脈的經典長程林道

Nov 2023【新北貢寮】山海相伴的雪山尾稜北段健行(福隆~石城)|秋天可欣賞芒草山稜與大海交織而成的美景

May 2023【台中南屯】地雷店食記|森鐵板燒|用餐體驗差,價格超貴卻豪無價值。小心別踩雷!!!

【美國加州】加州一號公路自駕遊~Half Moon Bay、17 Mile Drive、Bixby Greek Bridge、Big Sur、McWay Falls、Elephant Seal Rookery

Sep, 2021【苗栗南庄】蓬萊林道Off Road小試|雨後很爛很濕滑|二傳低底盤車勿輕易嘗試

Aug, 2023【桃園大溪】桃園小百岳編號23-溪洲山步道|適合訓練腳力、還能觀賞石門水庫的山水景色

May 2024【台北士林】坪頂古圳步道循山稜接荷蘭古道西線上北五指山、杏林山(天氣不佳,原路折返)

Feb, 2024【台中西區】桃太郎日本料理|隱身巷弄裡的39年老字號無菜單料理|食材新鮮、自然美味

文章列表

Contact

名稱

以電子郵件傳送 *

訊息 *