Codename Mira

Mira kódnéven fejlesztek egy keresőrendszert. Mondatértelmező rendszere képes a legkülönbözőbb kérések teljesítésére is. Gyere a blogomra és kövesd a fejlesztés történetét. A rendszer indulása: 2009. Január 5.

Friss topikok

  • Szücs József: @zooDoo: A kereső él és virul új neve Bluu lett. Azért nem szerettem volna postokban írni róla, m... (2009.08.14. 11:27) 100%-os képzőkezelés
  • atomvillanas: szia! fel tudnad velem venni a kapcsolatot a mosquito at seoblog pont hu cimen? koszi szepen! ... (2009.08.12. 09:55) Fejlemények
  • zooDoo: gondoljuk. Munkatársak: Józsi bácsi a büféből Feri bácsi a takarító. stb. (2009.04.01. 12:57) Teljes rendszer átírása
  • werjio: Itt van néhány: www.kislexikon.hu/ Ez nagyon jónak tűnik, szerintem vele érdemes lenne felvenni ... (2008.12.13. 07:59) Magyarázó
  • werjio: Szia, Egy hasonló funkciót találtam a google-nál is, nézd meg hátha ad új ötleteket: labs.google... (2008.12.13. 07:49) Asszociáció

Linkblog

A kezdetek

2008.08.06. 00:08 | Szücs József | 16 komment

 Mindenki azt hinné, hogy a kezdetek könnyűek voltak. De nekem először az ötlet volt meg. Programozni tudtam C-ben Pascalban de a programom nyelvén nem. Megtanultam az alapokat olyan 2 nap alatt, hatalmas lökés volt, hogy az alapalgoritmust már akkor meg tudtam írni, viszont a nyelv internetes funkcióinak használatával nem voltam tisztában.

Ekkor írtam a prog.hu-ra. Viszont olyan hülyének kellett nézetni magam, hogy az már fájt. Ugye féltem, hogy valaki lenyúlja az ötletemet, ezért mindenki csak nevetett rajtam, úgy a 40. hozzászólás környékén valaki segített is. Aztán amikor kész volt a rendszer gondoltam az egyik topicba beszúrom a videót róla. Sikerült is de a 3. pozitív bocsánatkérés után a főfikázó a moderátor törölte. 

Utána amikor csak időm volt vonaton, órák között...stb a rendszert fejlesztettem.

Most nagyon fáradt vagyok, de holnap linkelek be képeket az első verziókról

A bejegyzés trackback címe:

https://mirasearch.blog.hu/api/trackback/id/tr21602716

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

nadi 2008.08.06. 03:31:40

Nagyon ügyes és kitartó vagy, így tovább. Egyszer még biztosan büszkék leszünk rád! Persze sokan is irigykednek :)

Nem kaptam ugyan meghívót tesztelésre, de tök egyszerűen lehet megnézni a tesztoldalt :) Nekem tetszik, bár lehet, hogy régebbi változatot néztem.

zooDoo 2008.08.06. 08:42:53

prog.hu egy sznob és hülye banda. Nekem feltűnt, van egy két ember, írogat, de közel sincs semmi értelmes mondanivalója, na meg javarészt csak fikázni járt fel, érteni nem értett semmihez.. Persze tisztelet a kivételnek, mert privátba volt aki segített értelmes ötletekkel is. Nekem tetszik az ötlet nagyon, hajrá!

Szücs József · http://www.bluu.hu 2008.08.06. 08:54:01

nem mindenki. Ha komoly kérdést teszel fel akkor ők válaszolnak. Viszont ha olyat amit én a kezdetekkor akkor először nevetnek majd talán válaszolnak.
+nagyon érdekelte őket, hogy miért kell ez nekem...

OnkelTom 2008.08.06. 10:06:08

A prog.hu egy külön tészta.
A fikázók mentségére talán, hogy tényleg sok az együgyű kérdés, a lusta kérdező. Akik nem hajlandók fáradni a megtanulással, a guglizással sem, inkább másokat "dolgoztatnának" meg a virtuális pontjaikért. A sokadik sablonkérdés ugyanarról a problémáról már persze, hogy unalmas.
Viszont tény, hogy nekem is többször segítettek.
Magam is rendszeresen olvasgattam, egy-egy problémára most is rákeresek ott is (és szoktam találni támpontokat a megoldáshoz), de egy ideje épp a hullámzó színvonala miatt szoktam el onnan.

Álmos 2008.08.06. 15:58:07

Kíváncsi lennék, mit kezd a rendszer összetettebb kérdésekkel? A videókban bemutatt példák mind egyszerűek voltak, és hagyományos keresőmotorkkal is könnyedén megválaszolhatóak. De mi a helyzet mondjuk egy olyan kérdéssel, hogy "Milyen halakat lehet egy akváriumban tartani neonhalakkal?" Vagy: "PHP-ban hogyan állapíthatom meg egy statikus metóduson belül, hogy mely leszármazott osztályból hívták meg?"
Mert úgy gondolom, a valós életben ezek azok a kérdések, amelyeket a google nem képes néhány másodperc alatt megválaszolni.

Szücs József · http://www.bluu.hu 2008.08.06. 17:59:49

Álmos - Az akváriumos kérdés viszonlag könnyen leprogramozható, általános jellegű. A PHP-s kérdésre valóban nem tud (még) válaszolni.

Akkor tedd már fel a Google-nak hogy mi a Budapest Bécs közötti menetrend buszon vonaton? Vagy mennyi most az euró árfolyama? vagy Milyen idő lesz holnap?
Vagy kiváncsi vagyok a Google meg tudja e mondani a hozzád legközelebbi autószerelőt. Vagy hirtelen megtudja a Google mondani hogy mit jelent az apple szó?

Hidd el leteszteltem és rengeteg olyan egyszerűnek tűnő kérdés van amire a Google nem tud megoldást mutatni.

Természetesen biztos lesznek megválaszolatlan kérdések is, amit a rendszer azonnal küld nekem, hogy a további fejlesztések valóban olyan irányúak legyenek mint amire a felhasználóknak szüksége van.

+Mikor állítottam, hogy a rendszer képes lesz 3 mellékmondatot is tartalmazó kérdésekre válaszolni?

De akkor pontosítok: A rendszer mint már említettem nyelvtani szabályokra alapozza az értelmezését. Egyszerű mellékmondatok nélküli kérdő mondatokra tud válaszolni.

Álmos 2008.08.06. 18:30:23

A google egy kereső, nem pedig "minden kérdés tudója". Így hát nem kérdésre válaszol, hanem megmondja melyik oldalon találom meg a válaszomat. Ha ezt a különbséget félre tesszük, a példáid könnyedén megoldhatók vele. Nézzük sorban:

1. 'nemzetközi busz menetrend' keresőszavakra első találat a volánbusz honlapja, ahol megnézhetem a menetrendet. A "busz" szót "vasút"-tal helyettesítve az első találat az elvira.

2. pénzt váltani speciel a google is úgy tud, mint a mira: '1 EUR in HUF' kulcsszavakra megkapom, mennyit ér most egy euró forintban.

3. az 'időjárás' kulcsszóra egy rakás oldalt kapok, ahol megnézhetem a holnapi időjárást. (első találat: idojaras.hu)

4. az 'autószerelő budapest' kulcsszavakra egy rakás pesti autószerelő címét megkapom.

5. a google nem szótár, de az 'angol magyar szótár' kulcsszavakra az első találat a sztaki szótára.

Végeredményben úgylátom egy példát sem tudtál felhozni, amit a google ne válaszolna meg pillanatok alatt. Úgylátom különbség annyi, hogy a mira egyből a választ próbálja meg megadni, míg a google csak azt az oldalt ahol a válasz van. De számottevő különbség ez? Szerintem nem.

A mondatértelmező mennyire általános? Minden kérdés típus egyenként, kézzel van belekódolva (pl. a tömegközlekedéses kérdések)? Mi történne ha hirtelen 100 000 ember elkezdené használni, és ezrével özönlenének az egzotikusabbnál egzotikusabb kérdések? Mindet átnéznéd kézzel, és megpróbálnád megtanítani a rendszernek a választ? Pl. a jelenlegi rendszer mit válaszol az akváriumos kérdsére?

Ne értsd félre, nem szívózni akarok, csak felmerültek bennem ezek a kérdések, és kíváncsi lennék a válaszokra. Ha már index címlapra is kerültél, valamit biztos tud ez a rendszer. Én szurkolok, hogy ebből valami jó süljön ki, meg hát amúgy is kollégák vagyunk =)

Szücs József · http://www.bluu.hu 2008.08.06. 20:49:07

Álmos - Először is köszönöm szépen szívesen veszem a hozzád hasonló építő jellegű kritikákat.

Néhány kattintást azért csak megspórolsz a rendszeremmel. Nézzük sorban: (melyik a könnyebb)
zárójelben a te megoldásaid:

1. Beírod a rendszerembe: buszmenetrend Budapestről Bécsbe? és a Budapest Bécs menetrend oldalon találod magad.
(ezzel szemben: Beírod a google-ba a busz szót, rákkattintasz az első találatra a volánbusz honlapjára, beírod az indulási és az érkezési helyet és már ott is vagy a megoldásnál)

2. Beírod a rendszerbe "hány ft x euró?" (vagy beírod a a Google ba: "x EUR in HUF")
Kérdezd már meg 10 ből vajon hány ember tudja h a google ilyet is tud? Melyiket a szimpatikusabb beírni nekünk magyaroknak?

3. Beírod a rendszerbe "milyen idő lesz holnap Debrecenben" (vagy a te megoldásod beírod Google: időjárás, és megkeresed az időjárás.hu-n a Debreceni időjárást.) Sőt ha te debreceni vagy és beírod milyen idő lesz holnap a rendszer automatikusan a debreceni időjárást hozza. Spóroltál egy kattintást és itt is látszik a rendszer alkalmazkodóképesége.

4. Beírod a rendszerbe "autószerelő Budapest" vagy csak annyit autószerelő és lakhelyként Budapestet adsz meg. Megkapod szépen elrendezve az összes autószerelőt kezdve a hozzád legközelebbivel (te megoldásod Google: autószerelő budapest. Hmm Nekem a 10 első találatból csak 2-nél volt cím. Megnézheti bárki ha beírja.)
Itt is kattintásokat és mi több időt spórolsz meg a rendszeremmel, ami a mai rohanó világunkban nagy érték

5. Ezt a feladatot a rendszerrel egyszerűen elvégezheted: open jelentése? válasz nyitva
(Te megoldásod: Googleba beírod angol magyar szótár ami már több karakter mint az open jelentése. Katt a sztaki szótár találatra. És írd be hogy open.) Hogy is sikerül gyorsabban megoldanod.

Igazad van a Googleval is pillanatok alatt megkeresed, de néhány pillanattal azért így is hamarabb végzel a Mirával. Egy keresésnél még nem olyan nagy a külömbség de ha egymás után keresel 3 dolgot már meglátszik.
+ Gondolj csak bele: Sokan miért szeretik a Mac OS X-et. Nem kérdez nem szól vissza csak csinálja a dolgát és sokkal kevesebbet kell kattintani mint a Windowsban. Melyik rendszert lehet 1 gombos egérrel is tökéletesen használni?

Mira is valami ilyesmi, próbál emberközeli lenni mert ugye minden user biztosan tudja hogy a Googleba beírja: x EUR in HUF a valutaváltás módszere.

A mondatértelmező olyan mint egy lego. Van egy 200 darabos lego amiből egy csomó dolgot (mondatot) ki lehet rakni.

Nézzünk egy példát: tegyük fel a rendszerbe a következő szavak vannak algoritmizálva:
opera, kész, pite. de nincs kész a mikor

Jönnek az egzotikusabbnál egzotikusabb kérdések:
mikor mutatják be az x operát?
mikor van kész az almáspite?

Ha én algoritmizálom a mikor szót a dolog egy csapásra megoldódik és következő alkalommal már mind a két kérdésre érkezik válasz.

Az akváriumos kérdésre a rendszer iFrame-be betölti a wikipedia neonhal cikkét mert ott található akvárium cím és ez a rendszernek már elég hogy odavigyen. Tehát ezt tölti be iFramebe (az új találatlista):hu.wikipedia.org/wiki/Neonhal#Akv.C3.A1riumi_tart.C3.A1s

A nem megválaszt kérdésekből a rendszer statisztikát készít a legtöbbet előforduló még nem programozott szavakból. Nem kell kézzel átnéznem.

Köszönöm mégegyszer az építő jellegű kritikát.
Szivesen elfogadok ilyet másoktól is.

Álmos 2008.08.06. 21:11:21

Igen, azt mondod amit én is: a te rendszered az említett példákban pár (triviális) kattintással közelebb visz a megoldáshoz, mint a google. Ez jó, de nem biztos hogy elég ahhoz, hogy átcsábítsd az embereket más, bevált keresőktől. (és itt feltételezem, hogy bármilyen egyszerű kérdésre hasonló könnyedséggel tud választ adni a rendszer)

Pontosan mit jelent az, hogy egy szó "algoritmizálva" van? Egy fokkal technikaibb magyarázatra is kíváncsi lennék, ha nem üzleti titok :)

A neonhalas wikipedia cikkben valóban benne van, hogy milyen halakkal tartható együtt, de a rendszer ezt azért aligha tudhatta :) Csak kivette a kulcsszavakat a sallangból (akvárium, neonhal) és ezekre keresett? Ha azonban ezt tette, minek a mondatértelmezés?

Szücs József · http://www.bluu.hu 2008.08.06. 21:24:24

sajnos nem mondhatom el ez volt anno a nagy ötlet ami miatt elindítottam a rendszert.

Te komolyan úgy kezelsz engem mint valami Google pusztító. Értsd meg ez a rendszer egy teljesen más felfogásban működő rendszer. Ilyen a magyar piacon még biztos nem találsz és szerintem aki nem rendszergazda biztosan értékelni fogja az egyszerűségét és az azonnal kapott választ.
A Googles valutaváltást megkérdezted átlag userektől (lehetőleg ne programozóktól)? Vajon hány ember tudja?
Lehet neked a Google is könnyű megoldást jelent, lehet hogy te szeretsz kattintgatni de sok ember nem.


Egy kérdés ha kollégák vagyunk mi a te munkád?
A Google küldött? :)

Álmos 2008.08.06. 22:05:48

Pusztán azért hozom fel folyton a google-t, mert a mirát mint kereső motort mutattad be, és ezen a területen a google az egyértelmű piacvezető. És bizony keresők tekintetében nem nagyon van olyan, hogy "magyar piac", már csak azért sem mert a nagy keresőknek (google, live search) van magyar verzójuk. Még ha némileg más megközelítéssel dolgozol is, alapvetően ugyanazt az igényt akarod kielégíteni, amit ők. Emiatt gondolom, hogy érdemes összevetni őket.

És azt még hozzátenném, hogy ma már bőven nem kell rendszergazdának lenni ahhoz, hogy a google-lel könnyedén találjuk meg amit akarunk. Beletanultak az emberek a használatába, pl. anyukám is ügyesen megtalál vele bármit, pedig neki aztán semmi köze az informatikához :)

Egyébként arra nem válaszoltál, hogy tulajdonképpen mi alapján történt a keresés a halas kérdésnél?

A kollégát azért írtam, mert én is mérnök informatikus hallgató vagyok (a BME-n), mellette egy cégnél (ami nem a google) programozok. Szabadidőmben pedig a sufniban hegesztem a google-t megdöntő kereső motort. Najó nem ;) De fejlesztettem már ezt-azt webre is, illetve jelenleg is dolgozom egy kevésbé világmegdöntő, ámde véleményem szerint szintén hasznos projecten :)

Szücs József · http://www.bluu.hu 2008.08.06. 22:27:01

Sajnos nem mondhatom el mi alapján történt a keresés. Ezzel elmondanám az értelmezőrendszer működését, neked már csak meg kellene írni az algoritmust (ami egyébként összesen 12MB és nincs benne a 7 modul és a műveleti memória) és eladni a Google-nak :)

Álmos 2008.08.06. 22:46:18

Mi 12MB? Egy algoritmus? Na ne már, az annyi mint a teljes 2.2-es linux kernel forráskódja... És hogy jön ide a műveleti memória? Most tesztelsz, hogy tudom-e mi az? :)

Azt elárulod, hogy milyen nyelven írod az alkotást?

Szücs József · http://www.bluu.hu 2008.08.06. 23:27:50

12 MB 126 fájl összesen. Ennyi alkotja a rendszert jelenleg (képek+adatbázisok nélkül).
Nem is tudhatod mi az, ezt a nevet én adtam a rendszernek egy részének. Azon változók többsége amelyek az emberi memóriához hasonlóan köztes dolgokat tárolnak.

Van még ilyen név: Commander mód (kikapcsolható) annyit takar, hogy ha beírod index vagy origó az oldal jelenjen meg és ne keresés fusson le.

Speed üzemmód: (bekapcsolható) nem tölti be a képeket csak a dockon (felső hullámzó menü). A modemeseknek és a mobilról internetezőknek akiknek korlátozott az adatforgalom.

Álmos 2008.08.06. 23:50:12

Akkor úgylátom te "algoritmus" alatt a teljes rendszert érted... "műveleti memóriának" pedig mást szoktak hívni, de ezekszerint te ezt is más értelemben használod.. :)

Amúgy furcsa, hogy eddig semmi szakmailag megfogható dolgot nem mondtál. Az rendben van, hogy nem árulod el a briliáns ötleted, de azért az biztos nem okozna bajt, ha a használt programozási nyelv(ek)et megemlíted. Például kíváncsi lennék, miben írtad a keresőbotot?
süti beállítások módosítása