TUDOMÁNY
A Rovatból

Alig 200 óra alatt tanítottak meg magyarul egy mesterséges rendszert

A modell ráadásul relatíve olcsó, kevesebb mint 1000 euróba került.
Fotó: Gerd Altmann/Pixabay (illusztráció) - szmo.hu
2021. augusztus 26.



Nagyjából 15 millió ember beszéli a világ közel 7,7 milliárd lakosából a magyar nyelvet, amivel jelenleg a 78. helyen állunk a világ nyelvei között. Azt nézve nem is olyan rossz hír ez, hogy bár biztos számot nehéz mondani, még most is jóval 6 ezer felett van a beszélt nyelvek száma a Földön. Az viszont természetes vágy ilyen méretű beszédközösségnél, hogy szívesen használnánk anyanyelvünket az informatikai világban is. Ahhoz azonban sajnos a 15 millió beszélő kevés, hogy a nagy cégeknek megérje kifejleszteni a magyarul beszélő szoftvereket.

Most azonban a Pécsi Tudományegyetem (PTE) Alkalmazott Adattudományi és Mesterséges Intelligencia-csapata a Microsoft Azure mesterséges intelligencia és az ONNX Runtime megoldások alkalmazásával megépítette és betanította saját BERT-large modelljét magyar nyelven, méghozzá kevesebb, mint 200 munkaóra és 1000 euró befektetésével - adják hírül a Microsoft honlapján közzétett közleményükben.

A nagy mennyiségű magyar nyelvű adat kezelését megkönnyítendő a PTE természetes nyelvfeldolgozási (NLP) módszerek kutatásába fogott.

A megoldást egy magyar nyelvű BERT-large modell (HILBERT) létrehozása jelentette, ami egy nyílt forráskódú gépi tanulás keretrendszer. A modell célja, hogy segítse a számítógépet a többféleképpen értelmezhető szövegrészek megértésében oly módon, hogy a szövegkörnyezetből kontextust épít.

„A Microsoft piacvezető a nyelvi modellek betanításának területén. Természetes, hogy a legjobb technológiát akartuk használni” - mondta el Hajdu Róbert, az Alkalmazott Adattudományi és Mesterséges Intelligencia Központ volt tervezőmérnöke.

Ahelyett, hogy gyenge minőségű adatokat gyűjtöttek volna az internetről, a Nyelvtudományi Kutatóközpont szakemberei segítségével készítették elő az alapokat. Az Azure pedig mindent megkönnyített és felgyorsított.

A modell működéséhez egyébként legalább 3,5 milliárd szót tartalmazó folyószöveg szükséges, ezt az adatbázist a Nyelvtudományi Kutatóközpont, a projekt másik résztvevője többek között a Magyar Nemzeti Szótárból, online médiatárakból és az opensubtitles.org ingyenesen hozzáférhető filmfelirat-adatbázis magyar nyelvű anyagai közül gyűjtötte a csapat.

200 munkaóra alatt végeztünk. Ez a világon az eddigi legolcsóbb BERT-large. Kevesebb, mint 1000 euróba került

- mesélte Dr. Feldmann Ádám, a PTE Adattudományi és AI csoport vezetője. „Az ONNX Runtime nélkül a HILBERT-large modellünk betanítása 1500 órát, vagyis megközelítőleg két hónapot vett volna igénybe” – tette hozzá.

A Pécsi Tudományegyetem BERT-large modellje jelentős lehetőségeket rejt magában az írott és beszélt szöveg feldolgozása, az intelligens keresés, az entitásérzékelés, a dokumentációs klasszifikáció terén. A HILBERT közreműködhet újabb, jobb teljesítményű chatbotok létrehozásában is.

A projekt teljes, hosszabb ismertetőjét EZEN A LINKEN lehet elolvasni.


Link másolása
KÖVESS MINKET:

Népszerű
Ajánljuk
Címlapról ajánljuk


TUDOMÁNY
A Rovatból
Budapestnél nagyobb jégtömb szakadt le az Antarktiszon – elképesztő, mit találtak alatta a tudósok
A kutatók olyan ökoszisztémára bukkantak, amely akár évszázadok óta rejtőzve fejlődhetett a jég alatt.


Januárban hatalmas jéghegy szakadt le az Antarktiszon található George VI selfjégről. Az A-84 névre keresztelt jéghegyet az Amerikai Nemzeti Jégközpont azonosította. A jégtömb körülbelül 30 kilométer hosszú, 18 kilométer széles, így a területe meghaladja az 540 négyzetkilométert – ezzel még Budapestnél is nagyobb, írja a Discover.

A jéghegy leválásával egy korábban érintetlen tengerfenéki terület vált láthatóvá. A Schmidt Ocean Institute kutatói módosították expedíciójuk útvonalát, és megvizsgálták az újonnan elérhető szakaszt. „Megragadtuk az alkalmat, azonnal változtattunk az expedíció tervein, és megvizsgáltuk a mélyben zajló folyamatokat” – mondta Patricia Esquete, az Aveirói Egyetem kutatója.

Nyolc nap alatt távirányítású merülőeszközzel térképezték fel a tengerfenéket, és különböző élőlényeket figyeltek meg: korallokat, polipokat, óriási tengeri pókokat és szivacsokat. Néhány élőlény 1200 méteres mélységben is előfordult.

„Nem számítottunk arra, hogy ilyen gyönyörű, virágzó ökoszisztémát találunk. Az állatok mérete alapján ezek a közösségek már évtizedek, sőt akár évszázadok óta léteznek”

– tette hozzá a kutató.

A kutatók szerint ezen a területen a tápanyagok bejutását évszázadokon át akadályozta a körülbelül 150 méter vastag jégtakaró. Úgy vélik, hogy az óceáni áramlatok biztosíthatták az élővilág fennmaradásához szükséges tápanyagokat, de további vizsgálatokra van szükség.

A felfedezés hozzájárul ahhoz, hogy a tudósok jobban megértsék az úszó jégselfek alatti élővilágot, amelyről eddig kevés ismeret állt rendelkezésre. A kutatás során valószínűleg több eddig ismeretlen fajt is azonosítottak, valamint olyanokat is, amelyek már ismertek voltak.

Az expedíció során gyűjtött adatok segíthetnek az Antarktisz jégtakarójának múltbéli viselkedésének feltérképezésében is. „Az antarktiszi jégveszteség világszerte jelentős mértékben hozzájárul a tengerszint-emelkedéshez. A munkánk azért kulcsfontosságú, mert hosszabb távú összefüggéseket tár fel ezekben a változásokban, és segít pontosabb előrejelzéseket készíteni, amelyek megalapozhatják a jövőbeni intézkedéseket” – mondta Sasha Montelli, a University College London kutatója.

(via Blikk)


Link másolása
KÖVESS MINKET:

TUDOMÁNY
A Rovatból
A Holdba csapódhat egy hatalmas aszteroida, a Földről is látható lehet majd az ütközés
A 20 emeletes ház méretű égitest 2032 decemberében ütközhet a Holdnak. A becsapódás ereje 340 hirosimai atombombáénak felelne meg, és krátert vájna az égitest felszínébe.


A NASA új információkat közölt a 2024 YR4 jelű aszteroidáról, amely a számítások szerint

2032. december 22-én a Holdba csapódhat. A tudósok becslése szerint az ütközés ereje 340 hirosimai atombombának felelne meg, és körülbelül két kilométer széles krátert vájna a Hold felszínébe.

Az év elején a szakértők még csak 0,3 százalékos valószínűséggel számoltak a becsapódással, a legújabb mérések alapján azonban ez az arány 3,8 százalékra emelkedett. A James Webb űrtávcső segítségével a kutatók pontosabb adatokat kaptak az égitest méretéről is:

az aszteroida átmérője 53 és 67 méter közé tehető, ami egy nagyjából 20 emeletes épület magasságának felel meg.

A NASA hangsúlyozta, hogy az aszteroida nem jelent veszélyt a Földre, mivel nem képes megváltoztatni a Hold pályáját. A Live Science szerint előfordulhat, hogy kisebb törmelékek elérik a Földet, de ezek a légkörbe érve várhatóan elégnek, így nem okoznának kárt.

A becsapódás látványa viszont a Földről is érzékelhető lehet.

A James Webb űrtávcső májusban ismét megfigyeli az égitestet, így a kutatók tovább pontosíthatják a számításokat, és részletesebb képet kaphatnak a 2024 YR4 pályájáról és összetételéről.

2024 YR4 egy 40 és 90 méter közötti átmérőjű kisbolygó, Apollo-típusú (Földet keresztező) földközeli objektumnak minősül. Az ATLAS (Asteroid Terrestrial-impact Last Alert System) chilei állomása fedezte fel 2024. december 27-én.

A 2024 YR4 elliptikus pályán kering a Nap körül. Keringési ideje körülbelül 3,99 év, keringési szöge pedig 3,41 fok a Föld pályájához (ekliptikához) képest.

Forrás: Blikk, Wikipédia


Link másolása
KÖVESS MINKET:


TUDOMÁNY
A Rovatból
Videó: kilőtték az űrbe Katy Perryt öt másik női űrutazóval együtt, élőben lehetett követni a starttól a visszaérkezésig
A popsztár és társai magyar idő szerint hétfő délután emelkedtek a magasba a Blue Origin rakétájával. A történelmi női űrutazás alig 11 percig tartott, mégis hatalmas élményt nyújtott.


Katy Perry is részt vett azon az űrmisszión, amely magyar idő szerint április 14-én, 15:30-kor indult a Blue Origin New Shepard nevű rakétájával. Az NS-31-es küldetés során az énekesnő öt másik nővel együtt emelkedett a magasba.

A repülés tagja volt Lauren Sánchez újságíró, aki a Blue Origin űrvállalatot is birtokló Jeff Bezos menyasszonya. Mellette utazott Gayle King televíziós személyiség, Kerianne Flynn filmproducer, Aisha Bowe korábbi NASA-rakétatudós és Amanda Nguyen bioasztronautikai kutató, valamint polgárjogi aktivista.

Ez volt az első olyan űrutazás Valentyina Vlagyimirovna Tyereskova 1963-as, egyszemélyes küldetése óta, amelyen kizárólag nők vettek részt.

A repülés mintegy 11 percig tartott. A New Shepard rakéta több mint hét perccel az indulás után sikeresen földet ért, a legénységi kapszula pedig ejtőernyők segítségével tért vissza a Földre egy texasi sivatagban, a felbocsátás helyszínének közelében.

A kapszula ajtaját nagyjából tíz perccel a landolás után Jeff Bezos nyitotta ki. A résztvevők saját lábukon hagyták el az űreszközt. Míg más űrutazások után a legénység gyakran segítségre szorul a mozgásban, a mostani rövid időtartamú út nem jelentett nagy megterhelést.

A rakéta a világűr határának tekintett, 100 kilométeres magasságban húzódó Kármán-vonalat is elérte, így a résztvevők rövid időre megtapasztalhatták a mikrogravitáció, vagyis a súlytalanság állapotát.

A küldetéshez nem volt szükség pilótára, mivel az űreszköz teljesen önvezető. Az eseményt élőben közvetítették, a felvétel visszanézhető.

VIDEÓ: Az utazás


Link másolása
KÖVESS MINKET:


TUDOMÁNY
A Rovatból
Elképesztő magyar felfedezés: már az oxigénrobbanás előtt is voltak oxigént használó baktériumok
A legkorábbi oxigénhasználó baktériumok akár 900 millió évvel megelőzhették a légköri oxigén növekedését.


Elképesztő magyar kutatók jöttek rá, hogyan alkalmazkodott a földi élet az oxigénhez

A HUN-REN Ökológiai Kutatóközpont kutatói is részt vettek abban a nemzetközi kutatásban, amely új megvilágításba helyezi az oxigén és a baktériumok kapcsolatát, derül ki a kutatási hálózat honlapjáról. A Science tudományos folyóiratban megjelent tanulmányban a kutatók azt vizsgálták, hogyan fejlődtek a baktériumok, és mikor alakult ki náluk az oxigénhasználat képessége.

A kutatás alapját a körülbelül 2,33 milliárd évvel ezelőtt lezajlott Nagy Oxidációs Esemény adta, amely során a cianobaktériumok fotoszintézisének hatására jelentősen megnőtt a Föld légkörének oxigéntartalma. A folyamat pontos időzítése korábban a fosszilis leletek hiánya miatt nehézségekbe ütközött, ezért a kutatók most geológiai és genetikai adatokat is felhasználtak.

A vizsgálat során 1007 baktérium genomját elemezték, és összesen 84 olyan esetet találtak, amikor a baktériumok az anaerob – vagyis oxigénmentes – életmódról az aerob, oxigénhasználó életmódra váltottak. Ezek többsége a Nagy Oxidációs Esemény után történt, azonban legalább három ilyen átmenet jóval korábbra tehető.

A legkorábbi ezek közül közel 900 millió évvel előzte meg az oxigén jelentősebb légköri megjelenését.

A kutatók gépi tanulás segítségével azonosították az ősi aerob baktériumokat, majd bayesi statisztikai módszerekkel becsülték meg megjelenésük idejét. Feltételezésük szerint ezek a baktériumok a légkör oxigéndúsabbá válása után fejlődhettek ki.

A tanulmány szerint a ma élő baktériumok közös őse körülbelül 4,4–3,9 milliárd éve élt. A baktériumok főbb törzsei ennél később, 2,5–1,8 milliárd éve jelentek meg, míg számos ma ismert baktériumcsalád 0,75–0,6 milliárd évvel ezelőtt alakult ki, nagyjából az állati és növényi élet megjelenésének idején.

A kutatók egy új megközelítést alkalmaztak, amely a genetikai, fosszilis és geokémiai adatok együttes elemzésén alapul. Ez a módszer segíthet jobban megérteni az élet korai fejlődését, különösen azoknak a mikrobáknak az esetében, amelyekről nem maradtak fenn fosszíliák. A kutatók szerint a módszer a jövőben más mikroorganizmusok tulajdonságainak vizsgálatára is alkalmas lehet.


Link másolása
KÖVESS MINKET: