Codename Mira

Mira kódnéven fejlesztek egy keresőrendszert. Mondatértelmező rendszere képes a legkülönbözőbb kérések teljesítésére is. Gyere a blogomra és kövesd a fejlesztés történetét. A rendszer indulása: 2009. Január 5.

Friss topikok

  • Szücs József: @zooDoo: A kereső él és virul új neve Bluu lett. Azért nem szerettem volna postokban írni róla, m... (2009.08.14. 11:27) 100%-os képzőkezelés
  • atomvillanas: szia! fel tudnad velem venni a kapcsolatot a mosquito at seoblog pont hu cimen? koszi szepen! ... (2009.08.12. 09:55) Fejlemények
  • zooDoo: gondoljuk. Munkatársak: Józsi bácsi a büféből Feri bácsi a takarító. stb. (2009.04.01. 12:57) Teljes rendszer átírása
  • werjio: Itt van néhány: www.kislexikon.hu/ Ez nagyon jónak tűnik, szerintem vele érdemes lenne felvenni ... (2008.12.13. 07:59) Magyarázó
  • werjio: Szia, Egy hasonló funkciót találtam a google-nál is, nézd meg hátha ad új ötleteket: labs.google... (2008.12.13. 07:49) Asszociáció

Linkblog

Új Videó - Cégkeresés

2008.08.06. 12:53 | Szücs József | 25 komment

Az indexes cikkbe belekerült a rendszer cégkereső része.

Most egy videót is töltöttem fel a dologról működés közben. Az ott szereplő cégeket tesztből és nem reklámból raktam fel.

A cégkeresés a rendszeren úgy működne, hogy egy kis összegért évente mondjuk 5-8 ezer HUFért benne lehetnének az adatbázisban. Mindenki azonos jogokkal, a találatlistában a felhasználóktól való távolság döntene, tehát egy debreceni user valószínű, hogy nem fog győri találatokat látni. Két okból jó ez megoldás: a user hozzá közel tudja elintézni amit akar és a cégeknek is könnyebb a kapcsolattartás és az ügyintézés, ha hozzá közeliek az ügyfelek. Nem hiszem, hogy egy nyíregyházi usernek van értelme békéscsabai TV-szerelőt találatok közé tenni. A rendszer találatlistája befolyásolható ha így kérdezünk: Hol kölcsönözhetek autót Egerben? Ilyenkor a rendszer -akármi a user lakhelye- Egerhez fog viszonyítani.

A cégek megadhatják: elérhetőségeiket, képeket magukról, tevékenységi körüket, és egy rövid max 700 karakteres leírást cégükről. Ezeket szabadon módosíthatják a regisztráció ideje alatt. Hogy tetszik nektek?

Az ígért videó:

www.jstart.hu/mira3ceg.mov 

A bejegyzés trackback címe:

https://mirasearch.blog.hu/api/trackback/id/tr76603410

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Álmos 2008.08.06. 16:04:30

Ismét a szkeptikus szól belőlem: miért fizetnének egy forintot is a cégek egy (egyelőre) ismeretlen keresőmotorban való megjelenésre?

bond 2008.08.06. 17:12:54

Szerintem is elég felesleges...

Szücs József · http://www.bluu.hu 2008.08.06. 17:50:24

Ki mondta, hogy először fizetnük kell. Arra gondoltam, hogy egy bizonyos napi látogatószám felett kell majd, amit a Google Anylitics vagy Webaudit auditálna.

Bond - Ki mondta hogy felesleges? Velem rendgetegszer megesett már, hogy kellett volna valami és nem tudtam, hogy hol lehet venni. A múlkor pl. egy olyan csavar amelyet csak csavarszaküzletbeb volt. Nem vagyok semmilyen szerelő így nem tudtam merre van ilyen. De sorolhatnék még ezer esetet amikor hasznát tudtam venni egy ilyen szolgáltatásnak.

Vagy gondolj bele egy számodra ismeretlen városban vagy. (A rendszer mobilos böngészőn is működik) Lerobban a kocsid. Merre indulsz autószervízért? Megkérdezed a rendszert.

Tehát a cégkeresés szerintem nem felesleges.

Álmos 2008.08.06. 18:40:42

Nem mondtad, hogy először fizetniük kell, csak utaltál rá :)
Akkor ezt most úgy képzeled el, hogy jön a cég, ingyen beregisztrálja magát, megadja magáról az adatokat, és ha elég sokan kattintottak rájuk akkor pénzt kérsz tőlük?
Ismét google példát kell felhoznom. A 'csavarszaküzlet budapest' kulcsszavakra az első találat egy budapesti csavarszaküzlet, akinek semmit nem kellett ahoz tennie, hogy a google találataiban megjelenjen, nemhogy fizetni. Nem érzed úgy, hogy ehhez képest visszalépés a te megoldásod?

Koshinae 2008.08.06. 19:01:19

A google általános kerső, ez meg, ha jól értem hibrid, mert egyrészt automatikus indexelős és manuálisan tematizált is.

Szücs József · http://www.bluu.hu 2008.08.06. 21:00:47

Álmos - Nem érzem, hogy visszalépés direkt kipróbáltam beírtam a googleba. Nem rendezte a Google hogy a hozzám közelebbivel kezdje. Nem szépen rendezve jelentek meg az adatok.

A cégek nem költenek? Keresőoptimalizálásról hallottál már?

+azért gondolkodj a Google már több éve piacvezető, dollármilliókat költ fejlesztésekre, jól fizetett több száz főt számláló szakembergárdája van. Elnézést ha 2 éves fejlesztéssel magam fejlesztve néhány megoldásom rosszabb.

És én már többször is megemlítettem, hogy nem célom legyőzni a Google-t. Csak volt egy ötletem amit megvalósítottam. Álmom, hogy én csináljam az első valóban intelligens rendszert. Ha nem is teljesült lépéseket azért úgy érzem sikerült tennem, hogy ezt elérjem.

kereso · http://kereses.blog.hu 2008.08.06. 23:35:56

Itt vannak a jelenlegi cégkeresők magyarországon.
editors.dmoz.org/World/Magyar/Sz%c3%a1m%c3%adt%c3%a1stechnika/Internet/Keres%c5%91k/C%c3%a9gkeres%c5%91/

Csinálj olyat, ami valamiben egészen más. Ne hallgass a fanyalgókra.

netware · http://iwfw.hu 2008.08.07. 11:28:55

Nekem tetszik az ötlet. De amint latom te megoldottad azt a problemat amit en honapok ota keresek. Azt hogy hogyszamolod ki ket telepules kozotti tavolsagot. Ha tudnal segiteni benne dobj egy emailt.
Sok sikert a keresohoz.

Szücs József · http://www.bluu.hu 2008.08.07. 11:47:49

Pedig nagyon egyszerű több megoldás van:
Szerzel egy pontmátrix alapú adatbázist és annak megfelelően egy egyszerű programmal kikeresed a megfelelő távolságot.

Vagy begépeled az összes települést (vagy megszerzed a nevüket) és írsz egy olyan programot ami az összes települést az összessel összeveti a Google Mapsban. A kapott értékeket elmented egy mátrix szerű adatbázisban és az elsőhöz hasonlóan írsz egy progit ami kiszámolja a távokat.

Köszönöm a bíztatást!

E-mail írni csak úgy tudok ha megadod az E-mail címedet.

Álmos 2008.08.07. 12:50:45

Ehem.. pontmátrixból maximum nyomtató létezik ;) Persze, tudom: te ezt is más értelemben használod mint mindenki más. Szóval mit jelent nálad az, hogy "pontmátrix alapú adatbázis"?

Szücs József · http://www.bluu.hu 2008.08.07. 13:14:38

a mátrixot tudod, tanultad még elsőben.

Ezt jelenti:
A B C
A 0 2 7
B 2 0 4
C 7 4 0

Adatbázis mert sql-be mentem.
Egyébként nem csak én hívom így egy magyar távolságmeghatárózó szolgáltatás is így hívja. Ha nem hiszed keresd meg a google-n.

azért pontmátrix mert pontok(városok) közti távolságot tárol.

Egyébként mi bajod neked azzal hogy én mit, hogyan nevezek el?

Álmos 2008.08.07. 13:26:58

Az a helyzet, hogy te engem folyamatos jelleggel hülyének nézel. Tudom mi az a mátrix, és tudom mi az az adatbázis, csupán felhívtam a figyelmet arra, hogy pontmátrixnak mást szoktak hívni:

"A dot matrix is a 2-dimensional array of dots used to generate characters, symbols and images."

Ahogy az analízis tanárunk mondta: definiálhatod a kettőt háromnak és a hármat kettőnek, csak nincs semmi értelme. Ha ilyeneket mondasz, hogy "pontmátrix alapú adatbázis, mert pontok közti távolságot tárol" maximum kiröhögnek, akik értenek a szakmához.

És mi az a "magyar távolságmeghatárózó szolgáltatás"? Kaphatnék erről valami urlt?

Szücs József · http://www.bluu.hu 2008.08.07. 14:15:03

Nem nézlek hülyének.
Lehet, hogy te tudod mi az a mátrix de a blog olvasói nem biztos.

És elnézést, hogy sokat nem fogalmazok technikailag, de először is a felhasználók sem kiváncsiak rá, másrészt a rendszer technikai részleteit senkinek nem árulom el.

+ a nevek miatt meg röhögjenek csak. Nem a nevek működtetik a keresőt.

Álmos 2008.08.07. 14:21:14

Az utolsó kérdésre nem válaszoltál..

Szücs József · http://www.bluu.hu 2008.08.07. 14:30:32

Ha annyira könnyű a google biztos megtalálod....

Álmos 2008.08.07. 14:36:09

Kezdesz nevetséges lenni. És egyre inkább kókler szagot érzek...

Szücs József · http://www.bluu.hu 2008.08.07. 15:21:32

Figyelj

Neked nemvolt olyan hogy valamit másképpen hívsz mint ami a valódi neve? Nekem rengeteg ilyen van: MacOS X Leopard helyett Leó. Vagy miniszterelnökünk nekem Ferenc testvér.

Nekem nem lehetnek fantázianeveim. Mint a Googlenak a PageRank, vagy az Opelnek az Astra?

Te kezdtél el minden mondatomba belekötni(ami valljuk be egy kicsit idegesítő). Te mondtad, hogy milyen könnyű a Google. Te szóltad le a rendszeremet.

www.tavolsagkereso.hu/-n láttam település-mátrix adatbázis kifejezést én pedig elneveztem pontmátrixnak mert térképen lévő pontok közötti távolságot tartalmaz.

Akkor most mit vársz?
+ ki a nevetséges? mutass valamit aztán kritizálj...

+már szóltam nekem arról mik az erőviszonyok a Google és énköztem. nem vagyunk egy súlycsoport, de ehhez képest próbálom a maximumot kihozni.

Álmos 2008.08.07. 19:34:31

Egy létező kifejezést más értelemben használsz, mint amiben mindenki más, és ezt olyan természetességgel teszed, mintha ezt mindenkinek értenie kéne. Ezzel azt a benyomást kelted, mintha csak okoskodni akarnál, és valójában fogalmad se lenne róla, hogy mit beszélsz.

+mit mutassak? Küldek önéletrajzot tán?

Éber 2008.08.07. 23:21:57

Kedves Álmos, én úgy látom, hogy folyamatosan te vagy az aki okoskodik (kötekedik). Mondjuk ezen ne is lepődjünk meg, mivel a legtöbb fórumon, blogon ez megy. Szóval örülünk, hogy vagy és felnyitottad a szemünket, de nem fogjuk bánni, ha többet nem írsz. Egyébként én is megnézném a te általad fejlesztett portált, programot vagy amit fel tudsz mutatni. Akár egy Hello World! is megteszi.
Ami a mirát illeti, én örülök, hogy vannak ilyen kezdeményezések és drukkolok, hogy legyen sikere.
Az élet majd igazolja rövidesen mira is képes vagy mira nem :). De addig inkább bátorítsuk, vagy csak fogjuk be...

Álmos 2008.08.08. 01:13:31

Kedves Éber! Ha mindenáron tudni akarod, az egyik legnagyobb magyar egyetem informatikai infrastruktúrájának egy jelentős elemét fejlesztem, jelenleg egyedüliként. Attól tartok azonban, hogy (mivel nem végfelhasználói szolgáltatás) megmutatni nem tudom. Egy hello worldöt viszont szivesen prezentálok neked, mondjuk php-ban:

echo "Hello world!";

Ha többre is kíváncsi vagy, adj egy mail címet és szivesen megmutatom néhány apróbb magán projectem: fejlesztettem már multiplatform 3D-s repülős játékot opengl/c++-al, összetett logikai játékot javaban, logikai játékot linuxos mobil eszközökre, logikai játékot javaban mobiltelefonra (igen, szeretek játékokat írni), php-ban egy egyszerű blog motort, meg még sok más apróságot.

Ha a kompetenciámat tisztáztuk, engedtessék meg, hogy megkérdezzem: a blogon kommentelés kizárólag arra szolgál, hogy jókívánságaimról biztosítsam j-cool kollégát? Ha jól emlékszem én szkeptikusan bár, de alapvetően érdeklődve érkeztem ide, ahol cserébe folyamatosan hülyének lettem nézve. Lényegi kérdésre legfeljebb kitérő választ kaptam, vagy még azt sem. Senki nem kérdezte a mira csodálatos titkát, amit nyivlán el szeretnék adni a google-nek, de azért még a pagerank algoritmus körülbelüli működése is ismert dolog, ezek után nem tudom mi félni való lehet attól, hogy mondjuk megtudjuk milyen nyelven íródik a mira.

Az ilyen "pontmátrix alapú adatbázisok" szerű parasztvakításoktól meg kiráz a hideg. Ilyet tipikusan az szokott mondani, aki szeretné egymásra dobált szakszavakkal elkábítani a hozzánemértő közönséget. Igen, ez kötözködés. Ez van.

Szücs József · http://www.bluu.hu 2008.08.08. 08:13:02

Álmos - Elárulok egy kis technikai infót:

A redszer PHP-ban íródott kezdetben 4.x majd amikor a servert frissítették 5.x. A Mac OS X Tiger majd Leopard operációs rendszer alatt Smultron programmal (syntaxis highlight ebben volt a legszimpatikusabb).

A keresőmotor egyszerű fopen függvényre épül. A megnyitott oldalakat tagmentesíti(most nem sorolnám fel az összes stringfüggvényt amit használtam hozzá) kivéve persze a linkeket, és így halad tovább(viszont a saját működését ellenőrzi - de azt nem közölhetem hogyan). Az algoritmus legfontosabb feladata az oldal szöveges tartalmának érintetlen mentése (vastag és dölt betűs tageket is meghagyja), a linkeket is elmenti, de ennek jelenleg nincs jelentősége. A későbbiek folyamán talán még felhasználható. A motor (egyenlőre) nem tud képeket feldolgozni. Legnagyobb hibája jelenleg a sebessége: 6000 oldal/perc. Ennyi oldal 15 MB-t foglal egy mysql adatbázisban.

Ezzel a sebességgel 264 millió oldal indexelése kb 31 napot venne igénybe egy 4 magos Intel Xeon processzoron 1000 MBit/sec sávszélességgel.

Már elmítettem sosem voltál hülyének nézve, de azt sosem felejtsd el, hogy ami programozóként "parasztvakítás" a felhasználóknak élmény felhasználói élményről hallottál már?

Jó példa erre az iPhone: a legtöbb WM vagy Symbian alapú okostelefon funkciókat nézve megeszi reggelire, de az emberek nem a specifikációkat használják, hanem a kezelői felületet amiben pedig az iPhone (legyen technikailag akármilyen hátrányban is) verhetetlen. Adj oda egy embernek egy iPhonet és egy N95-öt. Melyik fog neki jobban tetszeni? Aki csak használni akar valamilyen eszközt nem fogja érdekelni, hogy hány MHz-es a proci, tud e 45 embernek egyszerre mms-t küldeni...stb.

Én is a felhasználó élményt és a könnyed kezelhetőséget tartom leginkább szem előtt. Ezért van a userhez való alkalmazkodás (erről majd töltök fel videót), a kérdések azonnali megválaszolására való törekvés, ezért fogok több kezelői felületet kialakítani(persze csak 1 lesz a befutó) Sok kis dolog ami magukban kicsivel gyorsabbak csak a konkurens megoldásoknál de a felhasználó kezében új élményt és könnyebb használatot jelentenek összeségében.

+ nem szemétségből csak kifelejtetted a hello word-ot a közé tenni. Nekem még ezek nélkül sosem működött :)

Szücs József · http://www.bluu.hu 2008.08.08. 08:17:04

Éber - Nem kell befogni. Ha valamilyen ötletemmel vagy a program valamelyik részével,szolgáltatásával kapcsolatban van ami szerinted nem jó vagy nem így kellett volna nyugodtan írj, hiszen nem biztos, hogy amit én jónak találok másnak is jó(lásd az elnevezéseimet).

A blog ezért is készült. Ha van valakinek valamilyen ötlete vagy valamit nem tart jónak, akkor szívesen várom és megbeszéljük.

Éber 2008.08.08. 09:54:02

Természetesen a "befogni" kifejezés nem annak szól aki építő jellegű véleményt formál meg. Az legyen akár pozitív vagy akár negatív. De amikor valaki állandóan azon rágódik, hogy honnan jött egy elnevezés és érdemi hozzászólást nem olvas tőle az ember, akkor inkább ne írjon semmit. Majd ezt követően még elkezd kóklerezni...

pBazsi 2008.08.09. 11:45:25

Engem pl. az érdekelne hogy hány gépre terveztetek ezt az egészet :)
És hogy terhelés mellet mit fog mutatni :)

Azért azt megnézném hogy tegyük fel kb. 31-nap alatt végignyalja a világhálót. Akkor osztunk szorzunk legyen 124 gép jelen felállásban akkor kb. 6 óránként végig tudná nyalni az egész hálót :)
Na akkor kérdem és hogy is van ez? Gyenge becslések szerinte is google-nak közzel 500.000 szervere van, ami ugyan csinál minden féle mást is mint gmail gmaps stb. De nekik se sikerül még naponta se leindexelni mindent... De lehet én gondolkodom rosszul ???

Szücs József · http://www.bluu.hu 2008.08.09. 12:06:15

Nem gondolkodsz rosszul.

Az előző kommentembe így írtam: "Ezzel a sebességgel 264 millió oldal indexelése kb 31 napot venne igénybe". Egy szóval nem említettem, hogy az egész webről van szó. A 264 millió a Google által indexelt magyar oldalak száma. Említettem, hogy a szövegértelmezés magyar nyelven történik. Emiatt nincs értelme az egész webet indexelni, mert nem tudnék mit kezdeni az angol és egyéb nyelvű szövegekkel.
süti beállítások módosítása