Einfache Projektliste Software-Karte

132 Projekte im Ergebnis
Letztes Update: 2019-04-21 23:51


Julius is an open-source, high-performance large vocabulary continuous speech recognition (LVCSR) engine for speech-related researchs and developments. With HMM acoustic model and language model, you can construct your own speech recognition system.

Moved to github: https://github.com/julius-speech/julius

Entwicklungsstatus: 4 - Beta, 5 - Produktion / stabil
Zielbenutzer: Entwickler, End Users/Desktop
Natürliche Sprache: English, Japanese
Betriebssystem: Linux, Windows, OS Unabhängig
Programmiersprache: C
Benutzerschnittstelle: Console (Text Based)
Aktivitätsart Perzentil: 2
Aktivitäten-Rangliste: 160Rang
Register Date: 2002-09-09 14:38
Letztes Update: 2014-03-06 20:44

eSpeak: speech synthesis

英語と幾つかの言語用のテキストの音声読み上げエンジンです。コンパクトなサイズで明確な発音が特徴です。 GnomeとKDE TTSシステムで動作します。また、Windows SAPI5とコマンドライン版も存在します。

Entwicklungsstatus: 5 - Produktion / stabil
Zielbenutzer: End Users/Desktop
Natürliche Sprache: English
Programmiersprache: C++
Benutzerschnittstelle: Command-line
Letztes Update: 2019-04-27 17:52



Entwicklungsstatus: 5 - Produktion / stabil
Zielbenutzer: End Users/Desktop
Programmiersprache: C++
Benutzerschnittstelle: Qt
Letztes Update: 2011-12-26 14:04


Linphone is an audio and video Internet phone with GTK+ and console interfaces. It uses the SIP protocol, and is compatible with most SIP clients and gateways. It can use various audio and video codecs such as Speex, GSM, G711, G722, ilbc, amr, Theora, H263-1998, MPEG4, H264, VP8, and snow.

Letztes Update: 2019-05-18 03:46


信号と知能の研究室からソースコード http://fich.unl.edu.ar/sinc

(Machine Translation)
Letztes Update: 2008-07-24 11:29


Speex is a patent-free compression format designed especially for speech. It is specialized for voice communications at low bit-rates in the 2-45 kbps range. Possible applications include Voice over IP (VoIP), Internet audio streaming, audio books, and archiving of speech data (e.g. voice mail).

Letztes Update: 2009-03-25 07:41


The FAAC project includes the AAC encoder FAAC and decoder FAAD2. It supports several MPEG-4 object types (LC, Main, LTP, HE AAC, PS) and file formats (ADTS AAC, raw AAC, MP4), multichannel and gapless en/decoding as well as MP4 metadata tags. The codecs are compatible with standard-compliant audio applications using one or more of these profiles.

Letztes Update: 2018-12-25 23:13


MMDAgent は、音声対話システムを構築するためのツールキットです。ユーザーは、ユーザー自身のダイアログのシナリオ、3D のエージェント、および声をデザインできます。このソフトウェアは修正 BSD ライセンスでリリースされます。

Letztes Update: 2016-05-05 00:02

Aozoravoice2 ms haruka Windows10

ここに紹介する読み上げソフト等は、SAPI5規格の音声合成エンジンと、 Microsoft Office 2010用の音声合成エンジン『Microsoft Speech Platform』に対応しています。

Windows10のMicrosoft Ayumi MobileとMicrosoft Ichiro MobileのSAPI5化を紹介しております。
Aozoravoice2の設定のWin10のMicrosoft Haruka DesktopとMicrosoft Ayumi MobileとMicrosoft Ichiro Mobileも提供しています。

Microsoft Speech Platform 11.0のインストールの仕方は、MS Harukaのインストール手引きをご覧下さい。
日本語のMS Harukaと英語(US)のen-US_ZiraProのSAPI5化も紹介しております(32bitOSかつ32bitソフト用のみ)。
また、Microsoft Speech Platformには、日本語、英語、ドイツ語等が用意されていますのでご活用下さい。

青空文庫をmp3に変換するソフトであるAozoravoice2の設定ファイルのMisaki版と、MS Haruka版を提供しています。

青空文庫 http://www.aozora.gr.jp/ http://ja.wikipedia.org/wiki/%E9%9D%92%E7%A9%BA%E6%96%87%E5%BA%AB

お勧めの読み上げソフトは、NoahさんのText To Wavです。テキスト(txt)の読み上げやmp3(lameが必要)に変換が出来ます。

Text To Wavは、読み上げ部分をハイライトしてくれる為、語学の勉強に最適です。


Microsoft Word のアドオンになる和太鼓も発達障害の読み障害の方の教材として、

フリーのスクリーンリーダ として、NVDA 日本語版があります。

99 SAMPLE MS HARUKA ver10.2.zip 10.2のMS Harukaのサンプル
05 win10.zip Microsoft Ayumi MobileとMicrosoft Ichiro MobileのSAPI5化とHarukaとAyumiとIchiroのAozoravoise2の設定
04 MS Haruka.zip MS Harukaのインストール手引き
03 MISAKI.zip  Aozoravoise2のMISAKI用の設定  
02 MS HARUKA-AOZORA2.zip MS Harukaのインストール手引きとAozoravoise2のMS Haruka用の設定
01 SAMPLE MS HARUKA.zip MS Harukaのサンプル 夏目漱石の「我輩は猫である」の一部をmp3化したもの

Betriebssystem: Windows 7, Windows Vista, Windows XP
Themen: Speech
Register Date: 2011-05-29 14:49
Letztes Update: 2005-11-14 13:35

PHP Voice

PHP Voice (formerly known as PHP VXML) contain four classes that assist in developing voice application using PHP. It supports Speech Synthesis Markup Language 1.0, Speech Recognition Grammar Specification 1.0, Voice Browser Call Control: CCXML 1.0, and Voice Extensible Markup Language (VoiceXML) 2.0.

Letztes Update: 2007-10-10 13:37


FlowDesigner is a data flow-oriented development environment. It can be used to build complex applications by combining small, reusable building blocks. In some ways, it is similar to both Simulink and LabView, but is hardly a clone of either.

(Machine Translation)
Letztes Update: 2008-12-23 17:37


eSpeak is a compact text to speech engine for good
quality English and other languages. Its clear
articulation and good intonation makes it suitable
for listening to long text articles. It can speak
text files from the command line, and also
operates as a "talker" within the KDE TTS system
and with a Gnome Speech driver, as an alternative
to Festival or other similar programs. Windows
SAPI5 and command line versions are also available.

(Machine Translation)
Letztes Update: 2013-03-03 19:13


MisterHouse is a Unix/Windows home automation program written in Perl. It can respond to voice commands, Web browsers, time of day, serial port and X10 data, external files, etc., and can speak via Text to Speech engines.

Letztes Update: 2013-11-14 02:07

CMU Sphinx

CMU Sphinx, a Speech Recognition System, is transitioning to Open Source. The distribution contains a library (libsphinx2) and some small examples that link against it.