[AI人工智慧] 如何用 AI 打敗reCAPTCHA驗證碼?!

  • 大數學堂
  • June 29, 2025, 10 p.m.
[AI人工智慧] 如何用 AI 打敗reCAPTCHA驗證碼?!

最近「爬蟲」話題又紅了起來,今天大數學堂不聊八卦,直接教你實用技術!我們要示範如何用 AI 輕鬆突破那些「我不是機器人」的圖片驗證,包括選紅綠燈、斑馬線、機車等各種 CAPTCHA 挑戰。使用 Google Gemini AI 搭配 Selenium 自動化工具,實現「魔法打敗魔法」- 用 Google 的 AI 來破解 Google 的驗證系統!

開始上課

[AI人工智慧] 只要100多行程式碼?! Gemini 2 Flash 顛覆你對即時翻譯的想像

  • 大數學堂
  • Dec. 15, 2024, 9 p.m.
[AI人工智慧] 只要100多行程式碼?! Gemini 2 Flash 顛覆你對即時翻譯的想像

Google最新推出的Gemini 2 Flash為AI即時翻譯領域帶來重大突破,開發者僅需撰寫約100行Python程式碼,就能實現即時影片和對話的翻譯功能。這套系統透過WebSocket實現即時通訊,採用每0.25秒分段處理音訊的機制,並整合了語音辨識與翻譯功能。儘管目前在中文語音輸出支援和翻譯精準度上還有改進空間,但系統已能在極低延遲的情況下提供高品質的翻譯結果。

開始上課

[AI人工智慧] 多模態AI應用實戰:輕鬆用Gemini 與 ElevenLabs 實現即時語音翻譯與合成

  • 大數學堂
  • June 3, 2024, 9:30 p.m.
[AI人工智慧] 多模態AI應用實戰:輕鬆用Gemini 與 ElevenLabs 實現即時語音翻譯與合成

自從看了GPT-4o的一個發表會以後,大家是不是對多模態模型都感到非常興奮呢?雖然我們現在可以在ChatGPT Plus使用到GPT-4o,但它並沒有展示會中所展示的語音輸入和輸出功能。 幸好的是,最近Google的Gemini也推出了多模態模型,而且也可以接受語音輸入。我就想,不如把這個技術結合語音合成,打造一個即時口語翻譯系統,而且更進一步,用自己的聲音翻譯!本影片將手把手教您如何使用Google的Gemini和ElevenLabs服務,讓AI自動翻譯您講的內容,並用你自己的聲音說出翻譯後的內容,大大降低溝通門檻。

開始上課