0

0
0

文字

分享

0
0
0

影片中的臉孔置換

鄭國威 Portnoy_96
・2011/12/05 ・223字 ・閱讀時間少於 1 分鐘 ・SR值 460 ・五年級

Kevin Dale, 美國哈佛大學的電腦科學研究所研究生,發展出了幾乎不需要複雜手動操作或是昂貴硬體的簡單技術,能讓你輕易更換影片中的正在講話的人臉,唯妙唯肖,難以判斷是被修改過的

Dale將他的論文全文放在網路上供人下載,不過我發文這時卻載不下來,因此還沒有深入看。這樣的技術如果更普及,對影像工作者來說就事倍功半了,然而如果這樣的技術真的普及到人人都能做,你會想用來幹嘛呢?

資料來源:Video Face Replacement

-----廣告,請繼續往下閱讀-----
文章難易度
鄭國威 Portnoy_96
247 篇文章 ・ 1301 位粉絲
是那種小時候很喜歡看科學讀物,以為自己會成為科學家,但是長大之後因為數理太爛,所以早早放棄科學夢的無數人其中之一。怎知長大後竟然因為諸般因由而重拾科學,與夥伴共同創立泛科學。

0

101
2

文字

分享

0
101
2
時間與空間的顛覆!如何用簡單的方式了解「相對論」?——《物理角色圖鑑》
azothbooks_96
・2024/09/16 ・2086字 ・閱讀時間約 4 分鐘

時間不再絕對?牛頓與愛因斯坦的時間觀差異

川村老師,請用簡單的方式告訴我「相對論」是什麼?

圖/《物理角色圖鑑》

老師:狹義相對論源自相對性原理(Principle of relativity,指物理定律〔Physical law〕適用於所有以等速直線運動的物體) 與光速恆定原理。根據這個理論,時間是相對的,依不同觀察者而有所差異。牛頓力學中的時間是絕對的,愛因斯坦則認為,可依不同的觀察者位置對時間進行不同定義。

圖/《物理角色圖鑑》

老師:之前在討論「力」時,也提過離心力。離心力是「慣性力」的一種,慣性力指物體在加速運動時感受到的與加速方向相反的力。置身在沒有窗戶的電梯中,當電梯向上加速,電梯內的人會受到向下的慣性力(譯注:因看不到外面,使得他無法判斷電梯的運動情況)。若加速度為 g,物體質量為 m,則物體所受慣性力為 mg,與在地面所受的重力 mg 相同。愛因斯坦無法區別這兩種 mg 的差異,所以視為等效。但無論慣性力的方向為何,物體都會往向量合成後的視重力場方向掉落。

時間在任何地方都固定不變嗎?

世界上最快的速度是光速。物體的移動速度若接近光速,它的時間進程就會變慢。也就是說,在接近光速的太空船上,時間會變得悠長。而且,接近光速的物體長度會朝行進方向收縮。

物體只要具有質量,即使在靜止狀態依然擁有能量(其能量 E mc2,稱為靜止能量(Rest energy)。

-----廣告,請繼續往下閱讀-----

提到光的運動,我們已經知道光的路徑會彎曲。

1919 年,天文學家觀測到恆星發出的光線在經過太陽附近時被偏折,這種現象稱為「重力透鏡效應」(Gravitational lens),有助於了解黑洞等宇宙中質量分布的情況。此外,天體物理學家也觀測到時間的延遲。簡而言之,接近地面的時鐘行進速度會比高處的時鐘慢,GPS 也是依據這種效應來進行校正。

圖/《物理角色圖鑑》
圖/《物理角色圖鑑》

時間

牛頓力學中的「時間」(也就是我們一般理解的時間)和相對論中的時間大異其趣。牛頓在《自然哲學的數學原理》(Philosophiæ Naturalis Principia Mathematica,1687)中,假設空間是均勻平坦的;從過去到未來,在任何地方都平均延伸。在牛頓力學中,全宇宙的時間一致。

但相對論否定了這一點。

-----廣告,請繼續往下閱讀-----
圖/《物理角色圖鑑》

光速恆定原理指出,光的速度是固定不變的。這種狀況下,空間中不同地點發生的兩件事,對某個觀測者來說是同時發生,但對另一參考系的觀測者而言則非同時發生。也就是說,時間的前進速度並非在任何地方都相同。因此,時間和空間不能視為各自獨立的兩回事,應該一體化,視為四維空間(時空,Spacetime)。

不過,這是指物體移動速度接近光速時的情況。日常生活中,使用過去的時間觀不會有任何問題。

黑洞

黑洞(Black hole)是一種天體,因為密度極高,重力極強, 不只物質,連光都會被吸進去,無法逃逸。天體是宇宙中所有物體的總稱,具體來說,指太陽、恆星、行星、星團、星雲等。從相對論來看,黑洞周圍空間是扭曲的。照以下方式想像應該會比較容易理解:

把重物放在一大塊展開的薄橡皮布上,放置處就會凹下去,而這塊凹陷會影響到周圍。同樣的,黑洞所在之處會發生猛烈的空間扭曲,經過附近的天體會被極強的重力吸引,落入其中,連光也難逃魔掌。

-----廣告,請繼續往下閱讀-----

銀河系有許多黑洞,但具體數字不詳。2019 年,一個跨國研究計畫團隊首次拍攝到黑洞的「影子」,掀起一陣討論熱潮。

——本文摘自《物理角色圖鑑:用35個萌角色掌握最重要的物理觀念,秒懂生活中的科普知識》,2024 年 9 月,漫遊者文化,未經同意請勿轉載。

-----廣告,請繼續往下閱讀-----

討論功能關閉中。

azothbooks_96
55 篇文章 ・ 21 位粉絲
漫遊也許有原因,卻沒有目的。 漫遊者的原因就是自由。文學、人文、藝術、商業、學習、生活雜學,以及問題解決的實用學,這些都是「漫遊者」的範疇,「漫遊者」希望在其中找到未來的閱讀形式,尋找新的面貌,為出版文化找尋新風景。

0

0
0

文字

分享

0
0
0
有圖有真相嗎?要怎麼分辨 AI 生成影像避免受騙?
泛科學院_96
・2024/04/28 ・719字 ・閱讀時間約 1 分鐘

2 月 15 日 OpenAI 發佈 Sora,隔一周後 Stable diffusion 3 隨後推出,以前人家都說有圖有真相,現在眼見不實的時代要來臨了,你說?還有什麼可以相信的?

AI 生成的影像到底有沒有方法可以辨識出來?今天,我們來談談近期關於辨識 AI 生成,找出 AI 生成的破綻!

先說結論,理論上可以!但現實很困難,很容易被破解,這集我們回答三個問題:

  1. AI 生成影像有什麼破綻?
  2. 還有哪些方法可以辨別 AI 生成的影像?
  3. 最後來談談這些辨識方法,在現實中會遇到什麼問題?

回到最基礎的問題眼見不再為憑,接下來只會越來越多,不會越來越少,謠言進化成謠圖跟謠影片,現在還真的沒有其他武器,來辨識 AI 生成的內容,說到底還是得回歸自身的媒體識讀、確認訊息來源!

-----廣告,請繼續往下閱讀-----

最後也想問問你,在這個大 AI 生成的時代,你會怎麼避免自己被 AI 騙呢?

  1. 相信大公司,相信聯合制定的浮水印規範終將落實
  2. AI 問題要用 AI 解決,相信辨識系統一定會完成
  3. 網路上的影像全是假的,是我眼睛業障重
  4. 其他答案也歡迎留言分享

更多、更完整的內容,歡迎上科學院的 youtube 頻道觀看完整影片,並開啟訂閱獲得更多有趣的資訊!

-----廣告,請繼續往下閱讀-----
泛科學院_96
44 篇文章 ・ 53 位粉絲
我是泛科學院的AJ,有15年的軟體測試與電腦教育經驗,善於協助偏鄉NPO提升資訊能力,以Maker角度用發明解決身邊大小問題。與你分享人工智慧相關應用,每週更新兩集,讓我們帶你進入科技與創新的奇妙世界,為未來開啟無限可能!

1

6
2

文字

分享

1
6
2
影片太長沒時間看?學習、追星必備神器!長影片總結、外語影片翻譯快速搞定!
泛科學院_96
・2024/03/02 ・3781字 ・閱讀時間約 7 分鐘

-----廣告,請繼續往下閱讀-----

「抱歉,我無法幫助提供關於特定 YouTube 視頻的摘要或重要觀點。」—— MaxAI

「 Sider 無法總結沒有字幕的影片。」—— Sider

「很抱歉,無法獲取您提供的 YouTube 影片的字幕資料,因為該影片已禁用字幕功能。請確認影片設置並開啟字幕,或者提供另一個可以分析的影片連結。」—— Video Summarizer

不是啦,怎麼全翻車了啦,這些 YouTube 的總結工具全都是垃圾⋯⋯嗎?

-----廣告,請繼續往下閱讀-----

先別急著罵,你有看到上面寫著「沒有提供字幕,無法分析」嗎?

常見的 Youtube 總結 AI,都是靠影片的字幕做分析,但如果影片沒有 CC 字幕,那這些 AI 就毫無用武之地了⋯⋯嗎?

欸不是喔,比如這支 16 年的 Bass 教學,聰明的 MaxAI ,就用下方網友留下的 5000 多則留言,總結出影片在說什麼。

這不是總結影片好嗎!我需要的是影片總結,不是總結網友討論!

而且,最需要影片總結的,不就是那些沒字幕,又看不完的超長直播影片嗎?

-----廣告,請繼續往下閱讀-----

像是泛科學院隔周四中午 12:30 的直播,含金量極高,講得都是最新 AI 新聞,但你可能非常忙,一秒鐘幾十萬上下,連一小時都抽不出來看重播,這時候,就非常需要影片總結服務。

那這些沒字幕的影片該怎麼辦?現在 AI 辨識語音也很厲害啦,就先語音辨識,再把這些辨識結果交給 ChatGPT 之類的 AI 做逐字稿分析不就好了嗎?

接下來,我想要分享兩個我覺得好用且免費的語音轉文字的 AI , Whisper JAX 跟 Memo AI。

Whisper JAX

先來說說 whisper JAX,你可以直接 google 搜尋就能找到,不用註冊也不用費用,點進去就可以直接使用。

-----廣告,請繼續往下閱讀-----

如果你懶到連搜尋都不想按,可以直接點擊 whisper JAX 的連結

語音轉文字的 AI 有很多,像之前介紹的 Vocol AI 就是,Whisper JAX 除了免費且逐字稿品質不差,更重要的是 Whisper JAX 只要輸入 Youtube 影片連結,就能完成逐字稿啦!

首先,點選上面的【Youtube】。

在這邊輸入 Youtube 影片的連結。

-----廣告,請繼續往下閱讀-----

下面選擇【transcribe】,按下送出鍵。

全都擠在一起是要怎麼看啦!別急著罵啊,這是錯誤示範,提醒大家在送出前,要把下面這個【Return timestamps】勾起來,才會跑出有時間序的分段內容。

Whisper JAX 雖然有翻譯【translate】功能,但只能翻譯成英文,不過問題不大,只要有了逐字稿一切都好辦。

Memo AI

覺得 Whisper JAX 還要把逐字稿貼到其他地方分析很麻煩,或是看英文影片,需要品質好的翻譯字幕嗎?

-----廣告,請繼續往下閱讀-----

別擔心,我跟你有同樣的想法,接下來介紹的 Memo AI,不只有 Whisper JAX 的所有功能,還可以串其他語言模型,讓你三個願望,一次完成。

首先,到官網下載 Memo AI 。

安裝完後打開 Memo AI,會看到鍵入金鑰的畫面。

這時候就要到官網註冊,註冊後在這邊填入 email 送出,然後到你註冊的信箱收信,就會看到 Memo AI 寄了金鑰給你,複製金鑰輸入 Memo AI,就可以使用啦。

-----廣告,請繼續往下閱讀-----

進入 Memo AI 能看到上面有輸入 Youtube 連結的地方,輸入後點轉譯,就會看到設定畫面。

這邊可以選擇原本檔案的語言,可以直接用自動偵測就好。

品質的部分,免費版只能用極速跟均衡,只有購買 pro 版的才能用高品質,不過對一般人來說,均衡就已經很夠用了,而且,Memo AI 的模型是在本機電腦上運作,如果你的電腦不夠好,也跑不出來。

最後,選擇是否用 GPU 加速,有的話可以選一下。好啦,現在按下轉寫,就會開始製作影片逐字稿了。

-----廣告,請繼續往下閱讀-----

完成逐字稿後,你可以在右上方選擇翻譯,這樣就會把整份逐字稿翻譯成你想要的語言了,翻譯的方式有免費的 google 翻譯,也可以自己串 API 用 ChatGPT 翻譯。

而在主畫面下方,你會看到總結的按鈕。

點下去會要你設定 API。

這時候你就要登入 OpenAI 的官網,取得 API KEY 後複製到【翻譯設置】中的 OpenAI。

左邊是輸入 API KEY 的欄位,右邊是輸入代理伺服器的位置,一般來說留空白就可以了。

現在按下總結鍵,影片總結就完成啦!

MemoAI 結合了 ChatGPT 之後,除了可以將影片內容做總結,他還能生成 AI 心智圖,看起來非常厲害對吧,好啦其實就是有結構的列點整理,對我來說,這比摘要還要容易閱讀。

另外,Memo AI 還可以將字幕匯出,直接把英文字幕跟翻譯好的中文字幕同步顯示,這下子看 Youtube 還可以學外語,把滑手機看影片,一秒就變成富有教育意義的活動。

現在,我們可以抬頭挺胸的看 YT 影片了。

既然 Memo AI 這麼好用,誰還需要 Whisper JAX ?

誰想得到 A 編居然還在用十年前的筆電,根本跑不動 Memo AI,而 Whisper JAX 就成了他唯一的選擇。

如果這支影片對你有幫助的話,請幫我在影片下方點個喜歡,並且把這支影片分享給需要的朋友,最後別忘了訂閱泛科學院的頻道,我們下支影片再見囉。

更多、更完整的內容,歡迎上科學院的 youtube 頻道觀看完整影片,並開啟訂閱獲得更多有趣的資訊!

-----廣告,請繼續往下閱讀-----
所有討論 1
泛科學院_96
44 篇文章 ・ 53 位粉絲
我是泛科學院的AJ,有15年的軟體測試與電腦教育經驗,善於協助偏鄉NPO提升資訊能力,以Maker角度用發明解決身邊大小問題。與你分享人工智慧相關應用,每週更新兩集,讓我們帶你進入科技與創新的奇妙世界,為未來開啟無限可能!
OSZAR »