Ai January 21, 2024 集仕多公司創辦人梁哲瑋發表AIGV平台,資策會發布「生成式 AI 輔助之軟體開發指引」 生成式AI引發全球巨大創新熱潮,據Expert.ai調查,78%企業意識到要有效地訓練企業專用GPT是重大工程;Build Your Own GPT(BYOG)成為企業面臨的全新挑戰,資訊工業策進會軟體技術研究院(資策會軟體院)自今年8月成立「AI 133 LAB」以來,持續發展「生成式AI輔助之軟體開發指引」,培訓AIGC(人工智慧產生內容)專業訓用合一職能人才,提供AIGC專業顧問服務,期能協助產業在這波生成式AI浪潮下成功轉型。 特別於11月2日舉辦軟體院科技日「1st STI TECH DAY」,以「前瞻趨勢與新興生態佈局」為題,聚集產學研專家共同探討產業趨勢與新興生態發展。繼8月份推出「2023企業應具備的AI素養-生成式AI導入指引」後,再以軟體開發為基礎,發表「生成式AI輔助之軟體開發指引」,分享BYOG顧問服務。資策會軟體院觀察到各產業對AI應用的需求,與業者共同定義AIGC發展策略,活動展示成果,透過產學研觀點分享,展現豐沛的BYOG能量與成果。 「生成式AI輔助之軟體開發指引」,提供投入生成式AI的軟體開發者,掌握生成式AI軟體開發作法,及可能遇到的問題與解決方案,建立負責任軟體開發機制所需的步驟、制定原則、可操作的規範等,來確保企業負責任地開發和部署AIGC,提高軟體開發效率。同時,資策會提供BYOG 顧問服務,此服務係以自身推動AIGC實務經驗,提供來協助公私單位發展自主有效安全、隱私、信任、合規的所屬企業大腦。並開設創新工作坊、示範案例、實做指引、技術工具、人才訓用合一培訓計畫等服務。 資策會楊仁達副執行長表示,企業建立屬於自己的知識大腦、百業百模是下一波應用趨勢,資策會作為資訊產業的關鍵角色,持續發展BYOG專業顧問服務,透過工具指引與相應的互動機制,確保供應端與需求端都能在這個生態系中受益。 資策會軟體院蒙以亨代院長表示,AI 133 Lab作為生成式AI生態系之關鍵角色,除了與台灣微軟、台智雲等多家產業,建立夥伴關係協同合作,除在醫材、資訊電子、金融進行示範案例,也將協助中華軟協規劃相關教育訓練計畫。不僅如此,軟體院未來也將透過制定生成式AI軟體基盤及共通架構,使資服業者能在安全的環境發展應用,企業需求端也能快速地找到合適的解決方案。 資策會軟體院將持續與產學研各界合作,成為前瞻技術與宏觀生態佈局之領航者,策進資服軟體產業發展,進一步驗證先進AI顧問服務模式及產業效益擴大策略。AI 133 Lab將持續賦能資訊服務業,促成業者創建不同領域的工具與知識模型,達到快速有效數位轉型目標。近期資策會將結合產學公協會各界,培訓數百位BYOG生成式AI人才專家,為生成式AI生態系添柴火,攜手資服業幫助公私部門達到快速數位轉型優化目標。 資策會軟體院舉辦第一屆軟體科技日STI TECH DAY,邀集產官學研與會貴賓出席共同合影,圖左起:資策會軟體院蒙以亨代院長、成功大學電資學詹寶珠院長、台灣微軟公共業務事業群陳守正總經理、數位部數位產業署胡貝蒂副署長、資策會楊仁達副執行長、台灣大學電資學院陳銘憲講座教授、工研院余孝先執行副總暨總營運長、陽明交通大學資訊學院陳添福副院長、清華大學電資學院賴尚宏副院長。 資策會軟體科技日STI TECH DAY,邀請專家學者共同暢談產業共融創新生態,圖左起為:台灣微軟公共業務事業群陳守正總經理、集仕多公司梁哲瑋創辦人、AWF台灣分會施吉昇主席、台灣智慧雲端吳漢章總經理、資策會軟體院蔡澤銘副院長。 集仕多公司梁哲瑋創辦人展示AIGV平台,集仕多公司ChoozMo創造獨家的AIGV平台,讓使用者在低成本下,可以快速從文字敘述生成高品質、完全客製化的圖片、AI主播模型和影片,並可以任意變換臉型,化妝,服飾,體格、背景、光源等等風格。不用進攝影棚,不用拍攝,幫助客戶用快速的方法把想法轉換成影片。ChoozMo的AIGV平台可以搭配客製聲音學習,並支援語言22國語言,畫質高達8K。ChoozMo的AIGV平台曾經使用於台灣領導電視平台,如三立新聞和華視,並受到觀眾的歡迎。 資策會軟體科技日STI TECH DAY現場,資策會發布「生成式AI 輔助之軟體開發指引」,貴賓進行技術交流。 資策會發布「生成式 AI 輔助之軟體開發指引」 | 集仕多公司創辦人梁哲瑋發表AIGV平台
Ai January 20, 2024 生成式AI有哪些 生成式人工智慧使機器不僅可以從資料中學習,還可以產生與用於訓練它的輸入類似的新資訊。其影響是多維的,因為該技術可用於設計、音樂、藝術等。 而且,隨著生成式人工智慧在多個行業的應用,許多公司都感受到了它的影響。根據我們的生成式人工智慧報告,文字應用程式是採用生成式人工智慧工具的首要原因(40.8%)。 為了理解為什麼該技術主要用於文字應用程序,我們將詳細探討主要應用程式。這些都是: 音訊應用 文字應用 對話式應用 數據增強 視訊/視覺應用 音訊應用 生成式人工智慧音訊模型使用機器學習技術、人工智慧和演算法從現有數據中創建新的聲音。這些數據可以包括樂譜、環境聲音、錄音或語音轉聲音效果。 模型經過訓練後,他們可以創建原創且獨特的新音訊。每個模型使用不同類型的提示來產生音訊內容,可以是: 環境數據 MIDI數據 使用者即時輸入 文字提示 現有錄音 生成式人工智慧音訊模型有多種應用: 1. 數據可聽化 模型可以將複雜的數據模式轉換為聽覺表示,使分析師和研究人員可以透過聲音理解和探索數據。這可以應用於科學研究、資料視覺化和探索性資料分析。 2. 互動音訊體驗 透過創建互動式和動態音訊體驗,模型可以為虛擬實境環境和視訊遊戲產生自適應音軌。這些模型還可以響應環境變化或使用者輸入,以提高參與度和沈浸感。 3. 音樂生成與創作 對於這些模型來說,創建音樂伴奏或創作原創音樂作品很容易;他們可以從現有的作品中學習風格和模式,以產生節奏、旋律和和聲。 4. 音訊增強與修復 您可以使用生成式 AI 來恢復和增強錄音,從而減少噪音、提高聲音的整體品質並消除音損。這對於出於存檔目的的音訊恢復非常有用。 5.音效創作與合成 模型可以合成獨特且真實的聲音,例如樂器、抽象音景和環境效果。他們可以創建複製現實世界音訊或全新音訊體驗的聲音。 6. 音訊字幕和轉錄 模型有助於實現語音到文字轉錄和音訊字幕的自動化,可以大大提高播客、視訊甚至現場活動等多種媒體格式的可訪問性。 7. 語音合成與語音克隆 您可以透過產生人工智慧模型來複製某人的聲音,並創建聽起來與他們一模一樣的語音。這對於有聲書旁白、語音助理和畫外音製作非常有用。 8.個性化音訊內容 透過使用生成式 AI 模型,您可以根據個人喜好創建個人化音訊內容。其範圍可以從環境音景到個人化播放列表,甚至是人工智慧生成的播客。 生成式人工智慧音訊模型如何運作? 與其他人工智慧系統一樣,產生音訊模型在大量資料集上進行訓練以產生新的音訊輸出。具體的訓練方法可以根據每個模型的架構而有所不同。 讓我們透過探索兩種不同的模型來看看這通常是如何完成的:WaveNet 和 GAN。 波網 WaveNet 由 Google DeepMind 創建,是一種基於深度神經網路的生成音訊模型。使用擴張卷積,它透過引用先前的音訊樣本來創建高品質的音訊。它可以產生逼真的語音和音樂,在語音合成、音訊增強和音訊風格適應方面都有應用。其操作流程包括: **波形採樣。**WaveNet 從輸入波形開始,通常是一系列音訊樣本,透過多個卷積層進行處理。 **擴張卷積。**為了辨識音訊波形中的長跨依賴性,WaveNet 採用擴張卷積層。膨脹幅度設定卷積層中感受野的大小,幫助模型區分擴展模式。 **自迴歸模型。**WaveNet 以自回歸的方式連續產生音訊樣本,每個樣本都受到其前輩的影響。然後,它根據先前的樣本預測即將到來的樣本的可能性。 **抽樣機制。**為了從模型的預測機率分佈中提取音訊樣本,WaveNet 採用了 softmax 取樣方法,確保了多樣化且真實的音訊輸出。 **培訓協議。**該模型使用最大可能性估計技術進行訓練,該技術旨在增加訓練資料對於模型參數的機率。 生成對抗網路(GAN) GAN 包含兩個神經網路:一個用於建立音訊樣本的生成器和一個用於判斷其真實性的鑑別器。概述如下: