社會(huì)語(yǔ)言學(xué)(sociolinguistics)是一門(mén)語(yǔ)言學(xué)的分支學(xué)科,研究社會(huì)的各層面對(duì)語(yǔ)言運(yùn)用的影響,包含文化準(zhǔn)則、社會(huì)規(guī)范或情境.
有人亦把后設(shè)語(yǔ)言學(xué)(metalinguistics,亦作“元語(yǔ)言學(xué)”)歸類(lèi)為社會(huì)語(yǔ)言學(xué)的一部分.
研究范圍社會(huì)語(yǔ)言學(xué)研究的是語(yǔ)言的社會(huì)本質(zhì)和差別,以及他們的社會(huì)因素.在傳統(tǒng)的語(yǔ)言地理學(xué)中也有相同的研究,但是自社會(huì)語(yǔ)言學(xué)出現(xiàn)以后,這些內(nèi)容都算做社會(huì)語(yǔ)言學(xué)的范疇了.
對(duì)社會(huì)本質(zhì)的研究包括:
* 語(yǔ)言的社會(huì)本質(zhì)的特點(diǎn)及其規(guī)律
* 語(yǔ)言、意識(shí)、社會(huì)在起源上的相互關(guān)系
* 民族語(yǔ)言和民族形成的關(guān)系
* 民族共同語(yǔ)的形成與社會(huì)發(fā)展的關(guān)系
* 語(yǔ)言演變與社會(huì)演變的關(guān)系
對(duì)語(yǔ)言差異的研究包括:
* 標(biāo)準(zhǔn)語(yǔ)與方言、行話(huà)的差異o 發(fā)音差異o 用詞差異o 地位差異* 同一語(yǔ)言在不同國(guó)家、地區(qū)以及社會(huì)所產(chǎn)生的差異
o 例如:英語(yǔ)在不同國(guó)家或地區(qū)的傳播中產(chǎn)生了變異,出現(xiàn)了美式英語(yǔ)、港式英語(yǔ)、新加坡式英語(yǔ)等
* 同一國(guó)家或社會(huì)中通行幾種語(yǔ)言所造成的差異
o 例如:有兩種或兩種以上官方語(yǔ)言的國(guó)家或地區(qū),如加拿大(英語(yǔ)、法語(yǔ))、新加坡(英語(yǔ)、中文、馬來(lái)語(yǔ))
* 不同的語(yǔ)言使用者在語(yǔ)言運(yùn)用上的差異
o 例如:性別差異導(dǎo)致男女使用有差異的語(yǔ)言.
* 社會(huì)場(chǎng)所不同所使用的語(yǔ)言的差異
o 例如:一般中國(guó)人在家庭環(huán)境中使用家鄉(xiāng)方言,在工作學(xué)習(xí)時(shí)用普通話(huà).
研究方法調(diào)查研究法對(duì)各地區(qū)、各行業(yè)、各階層等人的語(yǔ)言運(yùn)用進(jìn)行考察.數(shù)學(xué)分析法對(duì)口語(yǔ)材料和文獻(xiàn)資料進(jìn)行數(shù)學(xué)統(tǒng)計(jì)和數(shù)理分析.對(duì)比研究法分析社會(huì)因素、研究語(yǔ)言差異.實(shí)驗(yàn)分析法用語(yǔ)音或心理實(shí)驗(yàn)儀器對(duì)語(yǔ)言差異進(jìn)行實(shí)驗(yàn)分析,并作出定量和定性的描述.
語(yǔ)音識(shí)別技術(shù),也被稱(chēng)為自動(dòng)語(yǔ)音識(shí)別Automatic Speech Recognition,(ASR),其目標(biāo)是將人類(lèi)的語(yǔ)音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入,例如按鍵、二進(jìn)制編碼或者字符序列。
與說(shuō)話(huà)人識(shí)別及說(shuō)話(huà)人確認(rèn)不同,后者嘗試識(shí)別或確認(rèn)發(fā)出語(yǔ)音的說(shuō)話(huà)人而非其中所包含的詞匯內(nèi)容。 語(yǔ)音識(shí)別技術(shù)的應(yīng)用包括語(yǔ)音撥號(hào)、語(yǔ)音導(dǎo)航、室內(nèi)設(shè)備控制、語(yǔ)音文檔檢索、簡(jiǎn)單的聽(tīng)寫(xiě)數(shù)據(jù)錄入等。
語(yǔ)音識(shí)別技術(shù)與其他自然語(yǔ)言處理技術(shù)如機(jī)器翻譯及語(yǔ)音合成技術(shù)相結(jié)合,可以構(gòu)建出更加復(fù)雜的應(yīng)用,例如語(yǔ)音到語(yǔ)音的翻譯。 語(yǔ)音識(shí)別技術(shù)所涉及的領(lǐng)域包括:信號(hào)處理、模式識(shí)別、概率論和信息論、發(fā)聲機(jī)理和聽(tīng)覺(jué)機(jī)理、人工智能等等。
特定人語(yǔ)音識(shí)別的方法 目前,常用的說(shuō)話(huà)人識(shí)別方法有模板匹配法、統(tǒng)計(jì)建模法、聯(lián)接主義法(即人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn))。考慮到數(shù)據(jù)量、實(shí)時(shí)性以及識(shí)別率的問(wèn)題,筆者采用基于矢量量化和隱馬爾可夫模型(HMM)相結(jié)合的方法。
說(shuō)話(huà)人識(shí)別的系統(tǒng)主要由語(yǔ)音特征矢量提取單元(前端處理)、訓(xùn)練單元、識(shí)別單元和后處理單元組成,其系統(tǒng)構(gòu)成如圖1所示。 由上圖也可以看出,每個(gè)司機(jī)在購(gòu)買(mǎi)車(chē)后必須將自己的語(yǔ)音輸入系統(tǒng),也就是訓(xùn)練過(guò)程,當(dāng)然最好是在安靜、次數(shù)達(dá)到一定的數(shù)目。
從此在以后駕駛過(guò)程中就可以利用這個(gè)系統(tǒng)了。 所謂預(yù)處理是指對(duì)語(yǔ)音信號(hào)的特殊處理:預(yù)加重,分幀處理。
預(yù)加重的目的是提升高頻部分,使信號(hào)的頻譜變得平坦,以便于進(jìn)行頻譜分析或聲道參數(shù)分析。用具有 6dB/倍頻程的提升高頻特性的預(yù)加重?cái)?shù)字濾波器實(shí)現(xiàn)。
雖然語(yǔ)音信號(hào)是非平穩(wěn)時(shí)變的,但是可以認(rèn)為是局部短時(shí)平穩(wěn)。故語(yǔ)音信號(hào)分析常分段或分幀來(lái)處理。
歷史 早在計(jì)算機(jī)發(fā)明之前,自動(dòng)語(yǔ)音識(shí)別的設(shè)想就已經(jīng)被提上了議事日程,早期的聲碼器可被視作語(yǔ)音識(shí)別及合成的雛形。而1920年代生產(chǎn)的"Radio Rex"玩具狗可能是最早的語(yǔ)音識(shí)別器,當(dāng)這只狗的名字被呼喚的時(shí)候,它能夠從底座上彈出來(lái)。
最早的基于電子計(jì)算機(jī)的語(yǔ)音識(shí)別系統(tǒng)是由AT&T貝爾實(shí)驗(yàn)室開(kāi)發(fā)的Audrey語(yǔ)音識(shí)別系統(tǒng),它能夠識(shí)別10個(gè)英文數(shù)字。其識(shí)別方法是跟蹤語(yǔ)音中的共振峰。
該系統(tǒng)得到了98%的正確率。到1950年代末,倫敦學(xué)院(Colledge of London)的Denes已經(jīng)將語(yǔ)法概率加入語(yǔ)音識(shí)別中。
1960年代,人工神經(jīng)網(wǎng)絡(luò)被引入了語(yǔ)音識(shí)別。這一時(shí)代的兩大突破是線(xiàn)性預(yù)測(cè)編碼Linear Predictive Coding (LPC), 及動(dòng)態(tài)時(shí)間彎折Dynamic Time Warp技術(shù)。
語(yǔ)音識(shí)別技術(shù)的最重大突破是隱含馬爾科夫模型Hidden Markov Model的應(yīng)用。從Baum提出相關(guān)數(shù)學(xué)推理,經(jīng)過(guò)Labiner等人的研究,卡內(nèi)基梅隆大學(xué)的李開(kāi)復(fù)最終實(shí)現(xiàn)了第一個(gè)基于隱馬爾科夫模型的大詞匯量語(yǔ)音識(shí)別系統(tǒng)Sphinx。
[3]。此后嚴(yán)格來(lái)說(shuō)語(yǔ)音識(shí)別技術(shù)并沒(méi)有脫離HMM框架。
盡管多年來(lái)研究人員一直嘗試將“聽(tīng)寫(xiě)機(jī)”推廣,語(yǔ)音識(shí)別技術(shù)在目前還無(wú)法支持無(wú)限領(lǐng)域,無(wú)限說(shuō)話(huà)人的聽(tīng)寫(xiě)機(jī)應(yīng)用。 模型 目前,主流的大詞匯量語(yǔ)音識(shí)別系統(tǒng)多采用統(tǒng)計(jì)模式識(shí)別技術(shù)。
典型的基于統(tǒng)計(jì)模式識(shí)別方法的 語(yǔ)音識(shí)別系統(tǒng)由以下幾個(gè)基本模塊所構(gòu)成 信號(hào)處理及特征提取模塊。該模塊的主要任務(wù)是從輸入信號(hào)中提取特征,供聲學(xué)模型處理。
同時(shí),它一般也包括了一些信號(hào)處理技術(shù),以盡可能降低環(huán)境噪聲、信道、說(shuō)話(huà)人等因素對(duì)特征造成的影響。 統(tǒng)計(jì)聲學(xué)模型。
典型系統(tǒng)多采用基于一階隱馬爾科夫模型進(jìn)行建模。 發(fā)音詞典。
發(fā)音詞典包含系統(tǒng)所能處理的詞匯集及其發(fā)音。發(fā)音詞典實(shí)際提供了聲學(xué)模型建模單元與語(yǔ)言模型建模單元間的映射。
語(yǔ)言模型。語(yǔ)言模型對(duì)系統(tǒng)所針對(duì)的語(yǔ)言進(jìn)行建模。
理論上,包括正則語(yǔ)言,上下文無(wú)關(guān)文法在內(nèi)的各種語(yǔ)言模型都可以作為語(yǔ)言模型,但目前各種系統(tǒng)普遍采用的還是基于統(tǒng)計(jì)的N元文法及其變體。 解碼器。
解碼器是語(yǔ)音識(shí)別系統(tǒng)的核心之一,其任務(wù)是對(duì)輸入的信號(hào),根據(jù)聲學(xué)、語(yǔ)言模型及詞典,尋找能夠以最大概率輸出該信號(hào)的詞串。 從數(shù)學(xué)角度可以更加清楚的了解上述模塊之間的關(guān)系。
首先,統(tǒng)計(jì)語(yǔ)音識(shí)別的最基本問(wèn)題是,給定輸入信號(hào)或特征序列,符號(hào)集(詞典),求解符號(hào)串使得: W = argmaxP(W | O) 通過(guò)貝葉斯公式,上式可以改寫(xiě)為 由于對(duì)于確定的輸入串O,P(O)是確定的,因此省略它并不會(huì)影響上式的最終結(jié)果,因此,一般來(lái)說(shuō)語(yǔ)音識(shí)別所討論的問(wèn)題可以用下面的公式來(lái)表示,可以將它稱(chēng)為語(yǔ)音識(shí)別的基本公式。 W = argmaxP(O | W)P(W) 從這個(gè)角度來(lái)看,信號(hào)處理模塊提供了對(duì)輸入信號(hào)的預(yù)處理,也就是說(shuō),提供了從采集的語(yǔ)音信號(hào)(記為S)到 特征序列O的映射。
而聲學(xué)模型本身定義了一些更具推廣性的聲學(xué)建模單元,并且提供了在給定輸入特征下,估計(jì)P(O | uk)的方法。 為了將聲學(xué)模型建模單元串映射到符號(hào)集,就需要發(fā)音詞典發(fā)揮作用。
它實(shí)際上定義了映射的映射。為了表示方便,也可以定義一個(gè)由到U的全集的笛卡爾積,而發(fā)音詞典則是這個(gè)笛卡爾積的一個(gè)子集。
并且有: 最后,語(yǔ)言模型則提供了P(W)。這樣,基本公式就可以更加具體的寫(xiě)成: 對(duì)于解碼器來(lái)所,就是要在由,,ui以及時(shí)間標(biāo)度t張成的搜索空間中,找到上式所指明的W。
語(yǔ)音識(shí)別是一門(mén)交叉學(xué)科,。
歷史比較語(yǔ)言學(xué)在西方具有悠久的歷史,在現(xiàn)代語(yǔ)言學(xué)確立之前,語(yǔ)言研究主要是歷史比較語(yǔ)言學(xué)方面的研究,其研究?jī)?nèi)容也以語(yǔ)音研究為主。目前,漢語(yǔ)的語(yǔ)音史研究也逐漸開(kāi)始使用歷史比較語(yǔ)言學(xué)的研究方法,同時(shí)還要考慮語(yǔ)言接觸的問(wèn)題。
你在提問(wèn)中指出“根據(jù)方言的差異來(lái)考察語(yǔ)音的歷史演變”,既然是方言差異,就不可能“以一種方言為例”,所以,“以一種方言為例,說(shuō)明如何根據(jù)方言的差異來(lái)考察語(yǔ)音的歷史演變”是無(wú)法實(shí)現(xiàn)的。現(xiàn)在學(xué)界的研究方法,不但要比較多種方言的語(yǔ)音,還要參考日語(yǔ)、朝鮮語(yǔ)、越南語(yǔ)中漢語(yǔ)借詞的發(fā)音,在研究上古音的時(shí)候,還要分析漢字中的形聲字的讀音。也就是說(shuō),單純地比較方言語(yǔ)音并不能有效地考察語(yǔ)音的歷史演變。
就具體的操作方法來(lái)說(shuō),主要是考察方言間語(yǔ)音的對(duì)應(yīng)關(guān)系,而不是語(yǔ)音的相似性。利用語(yǔ)音對(duì)應(yīng)關(guān)系、語(yǔ)音發(fā)音的生理特點(diǎn)以及其他語(yǔ)言中的相類(lèi)似的語(yǔ)音現(xiàn)象,可以挖掘出語(yǔ)音演變的脈絡(luò)。
你指的是TCL C10的方言識(shí)別技術(shù)吧!這款電視的語(yǔ)音助手小T目前支持普通話(huà)、四川話(huà)、廣東話(huà)、東北話(huà)、河南話(huà)、陜西話(huà)6種方言的識(shí)別,并且識(shí)別能力還挺精準(zhǔn)的,拾音效果也不錯(cuò)。我也是看準(zhǔn)了這點(diǎn),才給我爸媽買(mǎi)的,這樣他們就不用說(shuō)著別扭的塑料普通話(huà)來(lái)語(yǔ)音控制了,直接可以說(shuō)廣東話(huà)。話(huà)說(shuō),我爸平常動(dòng)不動(dòng)就喜歡調(diào)戲小T,估計(jì)真的是猴鐘意小T啊。
聲明:本網(wǎng)站尊重并保護(hù)知識(shí)產(chǎn)權(quán),根據(jù)《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》,如果我們轉(zhuǎn)載的作品侵犯了您的權(quán)利,請(qǐng)?jiān)谝粋€(gè)月內(nèi)通知我們,我們會(huì)及時(shí)刪除。
蜀ICP備2020033479號(hào)-4 Copyright ? 2016 學(xué)習(xí)鳥(niǎo). 頁(yè)面生成時(shí)間:2.733秒