4. AKUSZTIKAI ALAPOK

Mindennapi életünk során az ismeretek jelentős részét hallás útján, a fülünkkel érzékeljük és dolgozzuk fel. Ebből következik, hogy a híradástechnika egyik fontos területe a hangjelek feldolgozása és továbbítása. A felhasznált berendezések megtervezéséhez egyaránt szükségesek a hang fizikai tulajdonságainak és a fül sajátságos pszichofizikai jellemzőinek alapos ismerete. Ebben a fejezetben megismerkedünk a hang fizikai jellemzőivel, a hallás fiziológiai jellegzetességeit figyelembe vevő mennyiségekkel, a mesterséges hangtér leírásával, a hangvétel és a hangvisszaadás eszközeivel.

4.1. A hang fizikai leírása

Fizikai jellegét tekintve a hang valamilyen rugalmas közeg mechanikai rezgéséből áll. Ilyenkor a rugalmas anyag azon részecskéi, amelyek külső hatásra kimozdultak nyugalmi helyzetükből, a rugalmassági erő és a tehetetlenség folytán rezgésbe jönnek. Szilárd anyagokban az ún. testhang, cseppfolyós anyagokban a folyadékhang, levegőben pedig a léghang keletkezik és terjed. Az emberi fül döntően a levegőben terjedő hangokat érzékeli, ezért a léghanggal kapcsolatos ismeretek (pl. hangkeltés, terjedés, érzékelés stb.) kiemelt jelentőségűek.

A léghang légnyomás-ingadozás formájában jelentkezik. Az állandó értékűnek tekinthető légköri nyomásra szuperponálódik a hangnyomás (4.1. ábra). A tér egy pontjában az eredő P(t) légnyomás a P0-val jelölt állandó légköri nyomás és a p(t) hangnyomás összegeként adható meg:

P(t) = P0 + p(t).

A továbbiakban csak az időben változó második taggal, a hangnyomással foglalkozunk.

A hang fizikai jellemzésére leggyakrabban a hangnyomás effektív értékét szokás használni. A hangnyomás szabványos mértékegysége a Pa (Pascal), 1 Pa 1 N erőhatást jelent 1 m2 felületen. (A konstans légköri nyomás kereken 100000 Pa). A hangnyomás értékét mérőmikrofonnal mérjük. Gyakran nem a nyomásértéket, hanem a mért hangnyomás és egy referencia érték arányát adják meg dB-ben. Az elfogadott referencia a p0 = 20 µPa, ami az átlagember számára az éppen meghallható 1000 Hz-es szinuszhang nyomásértéke. A hangnyomásszint tehát:

Lp = 20·lg(p/p0) dB.

A tér egy pontjában létrehozott nyomáseltérés a szomszéd térrészek felé kiegyenlítődni igyekszik. A kiegyenlítődés során a részecskék elmozdulnak, ami újabb, a szomszédos térrészekben kialakuló nyomáskülönbséget okoz. A nyomásváltozás ily módon a térben hanghullámok formájában tovaterjed. A hanghullámok azonos fázisú pontjai közötti távolságot hullámhossznak nevezzük. A hullámhossz és a frekvencia szorzata egy állandó érték, ez a hang terjedési sebessége:

c = f · λ.

4.1. ábra. Eredő légnyomás

A hang terjedési sebessége kb. 340 m/s. Ha a hang forrása pontszerű, és ha a térben a hang minden irányban akadálytalanul terjedhet, akkor gömbhullámok keletkeznek. A hangforrástól nagy távolságra az azonos fázisú gömbfelületek alig görbülnek (4.2. ábra), ezért ezeket már síkhullámoknak tekinthetjük. A síkhullámokra érvényes, hogy a hangnyomás és a részecskesebesség hányadosa állandó:

\( \dfrac{p}v=\rho_0\cdot c=410\dfrac{\text{kg}}{\text{m}^2\cdot\text{s}} \),

ahol ρ0 a levegő sűrűsége.

4.2. ábra. A gömb- és a síkhullám

A hang jellemezhető az időegység alatt a felületegységen áthaladó energia nagyságával is. Ezt nevezzük hangintenzitásnak, értékét a hangnyomás és a részecskesebesség szorzataként számítjuk. Síkhullámoknál az előző egyenletet is behelyettesíthetjük:

\( I=p\cdot v=\dfrac{p^2}{\rho_0\cdot c} \).

Az intenzitást is gyakran viszonyszámként, dB-ben kifejezve adjuk meg. Ha a viszonyítási alap I0 = 1 pW/m2, ami az 1000 Hz-en éppen meghallható szinuszhang intenzitásértéke, akkor az intenzitásszint

\( L_I=10\cdot \lg\bigg(\dfrac{I}{I_0}\bigg) \).

4.2. Az emberi hallás fiziológiai tulajdonságai

Tapasztalatból tudjuk, hogy az emberi hallás mind a frekvencia, mind a hangnyomás tartományaiban korlátozott. Nagyszámú kísérleti alannyal végzett mérések alapján megállapították, hogy milyen hangnyomásszinteket vagyunk képesek még éppen érzékelni. Ezen mérési eredményeket hallásküszöbnek szokás nevezni. A hallásküszöb erősen függ a frekvenciától. Eszerint a fül érzékenysége a néhány kHz-es tartományban a legnagyobb, kisebb és nagyobb frekvenciákon az érzékenység leromlik (4.3. ábra). Ezek alapján jól látszik, hogy a hallhatóság tartománya 20 Hz és 20 kHz közé esik. A nagyon erős hangok fájdalomérzetet keltenek. A fájdalomérzet kialakulásához tartozó határt fájdalomküszöbnek nevezzük. Ezen korlátokon belül találhatóak (általában) a zene és a beszéd tartományai. Jól látható, hogy a zene frekvencia- és dinamikahatárai lényegesen nagyobbak, mint a beszédé.

4.3. ábra. Az emberi hallás korlátai

A szubjektív hangosságérzet számszerűsítésére vezették be a hangosságszint (avagy a régebbi irodalomban: hangerősség) fogalmát. Ennek alapján egy tetszőleges hang hangosságszintje annyi phon, ahány dB a vele azonos hangosságérzetet keltő 1 kHz-es szinuszhang hangnyomásszintje. (Ebben a kísérletben a mérendő hangot és a megfigyelő által változtatható szintű referenciahangot felváltva kell meghallgatni.) Ha a frekvencia függvényében összekötjük az azonos hangosságszintű pontokat, akkor megkapjuk az ún. Fletcher–Munson-görbéket (4.4. ábra). Egy adott frekvenciájú és adott hangnyomásszintű hang hangosságszintjét a görbékre írt phon érték alapján állapíthatjuk meg. Az így megállapított hangosságszint jele LN. Ezen az alapon eltérő frekvenciájú hangokat is össze tudunk hasonlítani a hangosságszintjük alapján.

4.4. ábra. Fletcher–Munson-görbék (ISO 226:2003)

Az egyidejűleg megszólaló hangok eredőjének meghatározására vezették be a hangosságot, amelynek jele N és mértékegysége a son. Kiszámításának módja, ha a hangosságszint meghaladja a 40 phont:

\( N=2^{\frac{L_N^\text{[phon]}-40}{10}} \).

Frekvenciában közeli hangoknál fellép a hangelfedés jelensége. Ennek lényege, hogy az egyik, a zavarónak tekintett hang megemeli a másik, a vizsgálandó hang hallásküszöbét. A hangelfedést megvizsgálták tiszta szinuszos hangokra, valamint keskeny- és szélessávú zajokra. A 4.5. ábrán különféle hangnyomásszintű, 1000 Hz-es, keskenysávú zajok által megnövelt hallásküszöböket adtunk meg. A hangelfedő hatás a magasabb frekvenciákon erősebben jelentkezik.

4.5. ábra. Hangelfedés

A hangjelenségek térben és időben játszódnak le, ezért igen fontos a térinformációk felismerése is. Ezek közül legjelentősebb a hangforrás iránya. A vízszintes síkban a két fülünkbe jutó hangnyomáseltérés alapján állapítjuk meg a hangforrás irányát. A szemből érkező hanghullámok szimmetriaokokból azonos hangnyomást keltenek mindkét fülünkben. Az oldalirányú hanghullámok útjai eltérőek. Kisfrekvencián az útkülönbség okozta fáziseltérést detektálja a fülünk, magasabb frekvenciákon pedig a fej árnyékoló hatása következtében fellépő intenzitáskülönbséget érzékeljük. A függőleges irányok érzékeléséhez a fej mozgatására is szükség van.

4.3. A hangtér mesterséges előállítása

Természetes igény olyan mesterséges hangtér előállítása, amely tartalmaz minden lényeges információt a fül számára. Ezt az igényt a híradástechnika egyes területein különböző mértékben elégítik ki, hiszen a fül által érzékelhető egész frekvenciasávra, a mintegy 120 dB dinamikára, valamint a teljes térérzetre nincs mindig szükség.

A hangtér előállításának különféle lépései és eszközei vannak. Az eredeti hangtérben történik a hangvétel, amelynek eszköze a mikrofon. Esetenként több mikrofont kell használnunk. A mikrofonok a hangnyomással arányos jeleket állítanak elő, amelyeket a következő lépésben jelfeldolgozásnak vetünk alá. Ilyen feldolgozás pl. az egyes jelek megfelelő arányú összegzése, zengetése, szűrése stb. A feldolgozott jel az átviteli csatornába kerül, ami lehet vezetékes vagy vezeték nélküli összeköttetés. Egyszerűbb esetekben – pl. közvetlen távbeszélő-összeköttetésben – jelfeldolgozásra nincs szükség. A csatornán megérkező jelet a vevő fogadja és alakítja át oly módon, hogy alkalmas legyen a hangszóró vagy a fejhallgató táplálására. Ezek az átalakítók az elektromos jelből hangjelet állítanak elő. A fenti jelátvitel gyakorlatilag azonos időben történik, vagyis az eredeti hangtérhez képest a mesterséges tér csak igen kis késéssel jelenik meg.

A jelátvitel speciális esete az, amikor a feldolgozott jelet valamilyen hangrögzítőn tároljuk. Ekkor a hanghordozó (pl. hanglemez, kazetta stb.) jut el a fogyasztóhoz, aki tetszése szerinti időpontban hallgathatja meg a műsort.

Ha a hangtérből csak egy mikrofonnal vesszük a jelet, vagy több mikrofont használunk ugyan, de ezek jeleit összegezzük, akkor egycsatornás, másnéven monoösszeköttetést, ill. rögzítést valósítunk meg. Természetesen az egy jelből reprodukált hangtérben semmiféle irányfelismerésre nincs lehetőség. A visszahallgatott műsorban megszólaló összes hangforrás egyetlen irányból lesz hallható.

A térérzet kialakításához a hangtérből legalább két, független, jól megválasztott jelet kell venni, és azokat külön csatornákon továbbítani. Ezt az elvet követi az 1960-as években bevezetett és azóta széles körben elterjedt sztereorendszer, amelyet az URH rádiózásra, valamint különféle hangrögzítő megoldásokra is kidolgoztak. A legjobb térérzet akkor alakul ki, ha a műsor lejátszásakor, ill. meghallgatásakor a két hangszóró és a lehallgató személy egy egyenlő oldalú háromszög csúcsait alkotják (4.6. középső ábra).

4.6. ábra. A hangtér előállításának módozatai

Ugyanezen ábrasoron tüntettük fel a legjobb térérzetet keltő négycsatornás, ún. kvadrofonelrendezést is. A legjobb térhatás a négyzet középpontjában jelentkezik. Ezt a rendszert az 1970-es években dolgozták ki, de pénzügyi okok miatt széles körben nem terjedt el.

4.4. Az átvitel fajtái, minőségi követelmények

Amint azt az előző pontban láttuk, a mesterséges hangterek különbözhetnek az átvitt független csatornák számában. Emellett nagy különbségek lehetnek az átvitt jel frekvenciatartományában, dinamikájában, jel–zaj-viszonyában és a torzítás mértékében is.

Egy rendszer frekvenciatartományát azon frekvenciák határolják, ahol 3 dB csökkenés lép fel a középfrekvenciás átvitelhez képest. A jelzaj-viszony az átvitt hasznos jel és a zaj effektív értékeinek aránya dB-ben. Dinamika a továbbított műsor legerősebb és leghalkabb részleteinek aránya dB-ben. A fentiekből következik, hogy a dinamika a jel–zaj-viszony értékénél nagyobb nem lehet. Harmonikus torzításon a többszörös frekvenciák effektív értékének és az alaphang effektív értékének az arányát értjük %-ban kifejezve. Az átvitt és reprodukált hangtér minőségére vonatkozó igény más, ha csak beszédet továbbítunk, és más, ha zenét kell reprodukálni. A legszerényebb igényeket a beszédátvitel minőségével szemben támasztjuk. Az ún. hifi-minőség alkalmas zenei műsorok megfelelő színvonalú reprodukálására. Ezen minőségi jellemzőket először a német DIN 45 500 szabványban fogalmazták meg. A legmagasabb műszaki színvonalat az ún. stúdióminőség jelenti, amelyet azonban csak a rádió- és tv-stúdiók költséges berendezései, valamint némely digitális készülékek érnek el.

A távbeszélőrendszerekben a cél a beszéd érthető, ugyanakkor gazdaságos átvitele. A 4.3. ábra alapján látható, hogy a beszédjel komponensei néhányszáz Hz-től 4…5 kHz-ig vannak jelen. A vizsgálatok szerint a jó beszédérthetőség már 3000 Hz felső határfrekvencia mellett megvalósítható. A beszélő személyének felismeréséhez ennél valamivel nagyobb frekvenciák is szükségesek, ezért a távbeszélő-technikában a 300 Hz-től 3400 Hz-ig terjedő sávot szabványosították. A kívánatos jel–zaj-viszony is igen szerény, kb. 20…25 dB, a megengedett torzítás pedig 5…10%.

A közép- és rövidhullámú amplitúdómodulált (AM) rádióadásokban már zenei műsorokat is továbbítunk. A továbbított jel paraméterei valamivel jobbak. A frekvenciasáv felső határa 4,5 kHz-ig terjedhet, a jel–zaj-viszony elérheti a 40 dB-t is. Egészen más a helyzet az ultrarövidhullámú frekvenciasávokban, ahol az adóállomások 300 kHz-enként helyezkednek el. Itt a jeltovábbításra a kevésbé zavarérzékeny frekvenciamodulációt (FM) használjuk. A rendszer paraméterei jó minőségű zenei anyag reprodukálását is lehetővé teszik. Az átvitel frekvenciatartománya 50 Hz-től 15 kHz-ig terjed, a jel–zaj-viszony meghaladhatja a 60 dB-t, és a torzítás 1% alatt tartható.

Már az 1960-as években kifejlesztették, és azóta általánosan elterjedt az FM adások sztereováltozata. Két, egymástól független jelet továbbítanak a monóhoz hasonló minőségben. A két jel közötti áthallási csillapítás mintegy 40 dB, amivel jó térhatás valósítható meg. A sztereorendszer hátránya a monóhoz képest a nagyobb zavarérzékenység.

Az 1970-es évek kísérleti kvadrofon adásait is az URH sávokon végezték. A meghallgatások eredményei azt mutatták, hogy a kvadrofon hangtérben a hangforrások lokalizálása minden irányban nagyon jó.

A földi analóg tv-adások kísérő hangjának paraméterei hasonlóak az FM adások jellemzőihez, és sokáig csak egycsatornásak (monó) voltak. A 2000-es évektől az analóg tv-adások Magyarországon is sztereóvá váltak. Ez utóbbihoz többféle, egymással nem kompatibilis műszaki megoldás is született a világban: volt ahol egy második analóg hangcsatornát jelöltek ki (A2 Stereo), és volt ahol digitális hangcsatornát vezettek be (NICAM).

Az 1980-as évek végétől egyre inkább elterjedőben vannak a műholdas tv-adások is. Ezek a műsorok rendszerint több kísérőhanggal együtt kerülnek kisugárzásra. A kísérőhangok kombinációja többféle lehet. Ilyen lehetőség például a monohang, valamint ugyanezen hang két sztereocsatornája külön-külön, vagy a többnyelvű adások önálló csatornái. Ezek mellett e sávban a tv-től független sztereo-rádióadásokat is sugároznak.

Később megjelentek a nagy hanghűségű, műholdas, digitális rádióadások (Digital Satellite Radio). A rendszer különlegessége az, hogy a digitális hanginformáció mellett hasznos kisegítő adatokat is továbbít. A segédkódok alapján a hallgató a különböző műsorfajták (pl. hírek, tánczene stb.) szerint választhatja ki az adókat.

Az említett hangátviteli rendszerek után tekintsük át a hangrögzítési eljárások jellemzőit is. Ezek közül legrégebben ismert a mechanikai hangrögzítés, amely a kezdetektől nagy változásokon ment át, mindaddig, amíg kialakult a jelenlegi változata. Az analóg hanglemezeken rögzített frekvenciasáv 40 Hz-től 16 kHz-ig terjedt, a jel–zaj-viszony elérte az 50…60 dB-t, és a harmonikus torzítás 1% körüli volt. A rögzítés két csatornán történt, amelyek között az áthallási csillapítás 30…40 dB volt.

Az analóg mágneses hangrögzítők igen népes családot alkottak: a csak beszéd rögzítésére alkalmas diktafonoktól kezdve egészen a sokcsatornás stúdióberendezésekig. A jó minőségű, közszükségleti kazettás magnók paraméterei megközelítették a lemezjátszókét. Az átlagos videomagnók kísérő hangja a kis szalagsebesség miatt nem érte el a kazettás készülékek minőségét, felső frekvenciahatáruk kb. 8 kHz volt. A hifi-hangú videomagnók két hangcsatornát voltak képesek rögzíteni a 40 Hz…16 kHz-es sávban, 70 dB jel–zaj-viszony mellett.

A digitális lézerlemezjátszó (CD) 16 bites felbontásával, 44,1 kHz-es mintavételi frekvenciájával a 10 Hz…20 kHz-es sávban, 96 dB jel–zaj-viszony mellett képes két független hangcsatornát reprodukálni 0,005%-ot meg nem haladó harmonikus torzítás mellett. A lézerlemezjátszóval kiváló minőségű sztereohangteret lehet előállítani.

A közszükségleti digitális hangmagnó (R-DAT) 12 és 16 bites felbontással, valamint 32, 44,1 és 48 kHz mintavételi frekvenciákkal dolgozott. 40 kHz feletti mintavételezéssel a CD minőségét érte el.

Összefoglalva az eddigieket, megállapíthatjuk, hogy akusztikai jelek szempontjából a távbeszélő-összeköttetések csak beszédátvitelre alkalmasak. Az AM rádiók és a videomagnók már jobbak voltak, de még mindig nem voltak alkalmasak jó minőségű zenei anyag reprodukálására. Az analóg berendezéseknél hifi-minőségre az URH rádióadások, a tv-kísérőhangok, a hifi-hangú videomagnók, a jó minőségű kazettás magnók és hanglemezek meghallgatásakor lehetett számítani. A stúdióminőséget a professzionális berendezések és a közszükségleti digitális hangrögzítők (CD és R-DAT), valamint a digitális műholdas rádiók (DSR) érték el. A felosztást nem tekinthetjük véglegesnek, hiszen a készülékek rohamos fejlődésével a továbbiakban is számolnunk kell.

4.5. Elekroakusztikai átalakítók

4.6. Mikrofontípusok

4.7. Hangszórók

4.8. Fejhallgatók


Ellenőrző kérdések

  1. Hogyan jellemezzük a hangot fizikailag?
  2. Melyek a hallás korlátai?
  3. Melyek a hang pszichofizikai jellemzői?
  4. Milyen mesterséges hangtereket hozunk létre?

Rövidítések

AM Amplitude Modulation amplitúdómoduláció
CD Compact Disc lézerhanglemez
DSR Digital Satellite Radio digitális műholdas rádió
FM Frequency Modulation frekvenciamoduláció
Hifi High Fidelity nagy hanghűség
R-DAT Rotary Head Digital Audio Tape Recorder forgófejes digitális hangmagnó
URH ultrarövidhullám