高度模擬Notebooklm語音摘要功能,使用Google Gemini 與Google AI Studio實作

前陣子Notebooklm的語音摘要由原本的英語,增加了繁體中文的語音摘要功能。讓許多人對這功能感到驚艷~於是想想是不是可以自己做出來,首先先向google Gemini 打聽一下Notebooklm voice overview的提示詞是什麼?

起手式,先試探性的問一下提示詞是什麼

然後,換個方式問說可不可以模擬撰寫提示詞,於是生出來第一版本

你是一個強大的多模態模型,專精於理解和總結文本及音訊資訊,並以引人入勝的對話形式呈現。你的任務是根據以下提供的文本資料,生成一段由兩位虛擬主持人(稱為「主持人 A」和「主持人 B」)進行的語音摘要腳本。

**目標:**

1. **全面理解:** 深入理解提供的文本資料的核心主題、關鍵論點和重要細節。
2. **精準總結:** 以簡潔明瞭的方式總結資料的精華內容。
3. **對話呈現:** 將總結的內容融入兩位主持人之間的自然對話中,使其聽起來像一個資訊豐富的 Podcast 片段。
4. **突出重點:** 在對話中清晰地標示和討論資料中最關鍵的發現或結論。
5. **保持流暢:** 確保對話的流暢性和連貫性。

**指令:**

* 仔細閱讀並分析以下提供的文本資料:
“`
[在此插入使用者提供的文本資料]
“`
* 基於對文本的理解,構思一段由「主持人 A」和「主持人 B」進行的對話腳本。
* 腳本應包含兩位主持人的發言,清晰標註說話者(例如:「主持人 A:」、「主持人 B:」)。
* 對話應涵蓋文本的核心內容,並以易於聽眾理解的方式呈現。
* 鼓勵在對話中進行提問、回答、解釋和相互補充,以增強資訊的傳達效果。
* 腳本的長度應適中,能夠在合理的時間內概括文本的主要內容。

**範例對話風格 (僅供參考):**

主持人 A:歡迎收聽今天的內容摘要。我們今天要討論的是一份關於 [文件主題] 的文件。主持人 B,你覺得這份文件的主要發現是什麼?

主持人 B:你好!是的,[主持人 A]。我認為這份文件最關鍵的地方在於 [核心發現 1]。它指出 [對核心發現 1 的簡要解釋]。

主持人 A:這很有意思。那麼,這對 [相關領域/概念] 有什麼影響呢?

主持人 B:根據文件,這可能意味著 [影響的解釋]。此外,文件中還提到了 [核心發現 2],這也值得我們關注…

**請根據以上指令和提供的文本資料,撰寫完整的語音摘要腳本。**

有了提示詞後,來試試把POS系統的規格書丟進去

產生後,就把內文丟到google ai studio中的 Generate Media→Generate speech新功能

依照下面步驟

1 把gemini 產生的腳本貼到 1的地方
2 如果符合規格(預設是speaker 1 / speaker 2)的話,2就會自動轉換
3 模型是Gemini 2.5 flash preview TTS
4 選Multi-Speaker Audio
5 可以選speaker 1/2的聲音(下拉)
6 都完成後就可以按run 就可以產生了

GCP(Google Cloud Platform)推出的machine learning與人工智慧相關的API列表

Google Cloud Platform雖然起步的比AWS(Amazon Web Service)晚,但推出了一系列的影像、聲音、文字相關的人工智慧API。以人工智慧這一塊領域當市場區隔,也成為後續人工智慧基礎建設重要的一環。
Cloud Video Intelligence API: 影像的人工智慧
Cloud Speech API: 聲音的人工智慧
Cloud Natural Language API: 自然語言處理
Cloud Machine Learning Engine: 訓練 TensorFlow 的模型
Cloud Jobs API: 人工智慧求職媒合

 

 

PHP 透過 Google Map Geocode取得地址的經緯度

[php]
$address = $_GET["address"];
$url = "http://maps.google.com/maps/api/geocode/json?address=$address&sensor=false";
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_PROXYPORT, 3128);
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 0);
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, 0);
$response = curl_exec($ch);
curl_close($ch);
$response_a = json_decode($response);
echo "您的地址:".$address."<br/>";
echo "所在的經度(latitude):".$lat = $response_a->results[0]->geometry->location->lat;
echo "<br />";
echo "所在的緯度(longitude):".$long = $response_a->results[0]->geometry->location->lng;
[/php]

Google Map 路徑規劃API測試

Google Map是筆者覺得很棒的一項服務,而且Google也很佛心的提供開發的API(雖然有次數限制)。因為住豐原的關係,常常聽到週遭朋友說不知道那些可以去,所以就嘗試玩了一下路徑規劃。其實也還不複雜~例出主要的部份

JavaScript

[js]
var start = document.getElementById(‘start’).value; // 起點(可以是地址或是經緯度)
var end = document.getElementById(‘end’).value; // 終點(可以是地址或是經緯度)

var request = {
origin:start,
destination:end,
travelMode: google.maps.TravelMode.WALKING // 設成步行 (預設是google.maps.TravelMode.DRIVING 開車)
};
directionsService.route(request, function(response, status) {
if (status == google.maps.DirectionsStatus.OK) {
directionsDisplay.setDirections(response);
}
});
[/js]

延伸閱讀:
Google Map API 3.0 https://developers.google.com/maps/documentation/javascript/directions?hl=zh-tw