Invalid Click :: SEO Blog

2010. máj 27.

Szörcs with Google | Levél a Szörcs.hu fejlesztőinek

Szerző: | Kategória: Keresőoptimalizálás

A tényszerűség kedvéért. Ez a nyílt levél a Szörcs fejlesztőinek hétfőn lett elküldve, és péntek délre ígért válaszban egyeztünk meg. Miután a az elmúlt órákban arra lettem figyelmes, hogy az általam idézett találatok kezdenek eltünni a keresőből, illetve erősen kozmetikázásra kerültek, úgy gondoltam, hogy nincs értelme tovább várni. Itt van tehát az a levél, amelyben a Szörcs fejlesztőket kérdezem bizonyos a keresőjüket érintő alapvető dolgokkal kapcsolatban, és próbálom megvilágítani és bizonyítékokkal alátámasztani, hogy mit vélek problémásnak. A levél tehát itt van, a kommentek jöhetnek, a teszteket pedig mindenki próbálja ki maga, minden nyomot úgy sem lehet eltüntetni. A lényeg kiderül a továbbiakban.

Tisztelt Szörcs.hu fejlesztők!

Többször kerestelek Titeket a Szörcs feltérképezésével és indexelésével kapcsolatban, jobbára arra irányuló kérdésekkel, hogy a Szörcs kereső milyen IP címről és milyen User-Agent-el látogatja meg a weboldalakat, amikor feltérképezi azokat. Bár a Szörcs fejlesztői blogjában (http://szorcs.hu/blog/szorcs.szorcs/user-agent/) kitértek erre a kérdésre, gyakorlatilag az ott megjelentetett adatok már magukban is érdekesek. Hivatkoztok SSO-ra, és arra, hogy a weblapok jelentős része külön kezeli a keresőket. Szakmabeliként azt kell mondjam, hogy a hazai weblapok 99%-a egyáltalán nem kezeli a keresőket, nem hogy külön kezelné.
Egyrészt azért kerestelek meg titeket, mert a fent leírtak nemcsak engem, hanem a szakmát is foglalkoztatja. Másrészt pedig mint „tartalomszolgáltató” azért várok magyarázatot, mert a piacon lévő összes valódi keresőnél felvilágosítást adnak annak érdekében, hogy a rendszergazdák, webmesterek, SEO-sok ki tudják ezeket a robotokat tiltani, ha arra van szükség. Azt hiszem, ez nem irreális elvárás.

A kérdéseimre mellébeszélés-izű válaszok érkeztek.

Szeretném az érintettek segítségével és megkérdezésével blogomban bemutathatni a Szörcs valós működését, azaz: hogy vannak-e saját robotjaitok, rendelkeztek saját indexszel, vagy pedig csak a Google és Bing találatait rendezgetitek.

Leszögezném: semmi gond nincs azzal, hogy felhasználjátok ezeknek a keresőknek a találatait – más kérdés, hogy ez a Google Szolgáltatási Feltételeivel éles ellentétben áll – de akkor pl. a Johu.hu keresőhöz hasonlóan úgy korrekt, ha felvállaljátok, hogy egy másik kereső találatait rendezgetitek, tehát egy mashup jellegű szolgáltatást fejlesztettetek hozzáadott értékkel. Viszont az kommunikálni, hogy ez teljes egészében saját technológia, az inkorrekt. Megvezeti a felhasználókat és a szakmát.

Az említett Google Szolgáltatási Feltételek idevágó része : http://www.google.hu/accounts/TOS
„Ön semmilyen formában nem jogosult a Szolgáltatások reprodukálására, sokszorosítására, másolására, forgalomba hozatalára, illetve eladására, kivéve ha ezt az Ön és a Google között létrejött külön szerződés kifejezetten megengedi.”

Feltevésemet alátámasztására végeztem néhány olyan vizsgálatot, melyeket bárki el tudja végezni, csak egy kis időt kell rá fordítani. Az eredmények egyértelműek bárki számára, aki hajlandó elvégezni a teszteket. Manipulációnak helye nincs.
(A tesztek alapjául ez a poszt is szolgált: http://blog.lbi-netrank.co.uk/is-ask-jeeves-scraping-google/

1.vizsgálat – Új tartalom bekerülése

2010.05.23 14:21-kor élesítettem egy posztot a blogomon (seoblog.hu) a következő címmel: Három éves a SEO Blog | Boldog Születésnapot! , mely a következő URL-en jelent meg: http://www.seoblog.hu/szubkult/harom-eves-a-seo-blog-boldog-szuletesnapot/

A poszt 14:28-kor került be a Google indexébe, majd 14:30-kor a Szörcs-ön végzett kereséskor – poszt címére keresve – is megjelent.

Google találat

Szörcs találat:

Nem volt más dolgom, mint ezt a cirka 10 percnyi webszerverlogot átvizsgálni. Szerencsére vasárnap délután volt, így aztán igazán sok szemét nem került bele.

A logokban a következő adatok voltak az említett időszak tekintetében:

66.220.155.122 – - [23/May/2010:14:17:17 +0200] “GET /szubkult/harom-eves-a-seo-blog-boldog-szuletesnapot/ HTTP/1.1″ 200 9394 “-” “facebookexternalhit/1.0 (+http://www.facebook.com/externalhit_uatext.php)”

66.249.65.203 – - [23/May/2010:14:20:37 +0200] “GET /szubkult/harom-eves-a-seo-blog-boldog-szuletesnapot/ HTTP/1.1″ 200 9394 “-” “Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)”

212.51.122.137 – - [23/May/2010:14:25:07 +0200] “GET /images/SEOBirthday2009-300×274.jpg HTTP/1.1″ 200 32652 “http://www.seoblog.hu/szubkult/harom-eves-a-seo-blog-boldog-szuletesnapot/” “Mozilla/5.0 (Linux; U; Android 2.0; en-us; Milestone Build/SHOLS_U2_01.03.1) AppleWebKit/530.17 (KHTML, like Gecko) Version/4.0 Mobile Safari/530.17 NewsRob (http://newsrob.com) gzip”

188.157.124.178 – - [23/May/2010:14:25:14 +0200] “GET /images/SEOBirthday2009-300×274.jpg HTTP/1.1″ 200 32652 “http://www.seoblog.hu/szubkult/harom-eves-a-seo-blog-boldog-szuletesnapot/” “Mozilla/5.0 (Linux; U; Android 2.0; en-us; Milestone Build/SHOLS_U2_01.03.1) AppleWebKit/530.17 (KHTML, like Gecko) Version/4.0 Mobile Safari/530.17 NewsRob (http://newsrob.com) gzip”

67.195.112.163 – - [23/May/2010:14:25:20 +0200] “GET /szubkult/harom-eves-a-seo-blog-boldog-szuletesnapot/ HTTP/1.0″ 200 9394 “-” “Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)”

66.220.145.244 – - [23/May/2010:14:26:46 +0200] “GET /szubkult/harom-eves-a-seo-blog-boldog-szuletesnapot/ HTTP/1.1″ 200 9394 “-” “facebookexternalhit/1.0 (+http://www.facebook.com/externalhit_uatext.php)”

66.249.65.203 – - [23/May/2010:14:28:48 +0200] “GET /szubkult/harom-eves-a-seo-blog-boldog-szuletesnapot HTTP/1.1″ 301 20 “-” “Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)”

66.249.65.203 – - [23/May/2010:14:28:49 +0200] “GET /szubkult/harom-eves-a-seo-blog-boldog-szuletesnapot/ HTTP/1.1″ 200 9394 “-” “Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)”

66.249.65.203 – - [23/May/2010:14:28:51 +0200] “GET /szubkult/harom-eves-a-seo-blog-boldog-szuletesnapot HTTP/1.1″ 301 20 “-” “Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)”

Facebook, Yahoo! Bot, Google bot, és egy mobilról történő látogatás volt. Állításotok szerint a feltérképezés során Googlebotnak álcázzátok magatokat, így megvizsgáltam a Googlebot IP címét, mely ebben az esetben 66.249.65.203 volt. A WHOIS adatok alapján látszik, hogy ez egy, a Google birtokában lévő címtartomány. Az IP Spoofing mint olyan ebben az esetben ki van zárva.

Megállapítás: Az adott poszt úgy került be a Szörcs találatai közé, hogy bizonyíthatóan részükről nem történt feltérképezés a seoblog.hu-ra vonatkozóan, így az adott találatot egy másik kereső indexéből kellett kivenni, mely jelen esetben vagy a Google, vagy pedig a Yahoo! lehetett csak.


2.vizsgálat – IP cím és User-Agent ellenőrzés

Egy vizsgálat nem vizsgálat, ezért folytattam a nyomozást, bár egy szakértő számára talán már a fentiek is épp elég bizonyítékot szolgáltatnak.

Rengeteg olyan oldal van az interneten, mely az azt meglátogató felhasználó IP címét, illetve User-Agentjét jeleníti meg.

A mi szempontunkból ez ott érdekes, hogy amikor egy keresőrobot ellátogat egy adott oldalra, akkor az ő IP címe illetve User-Agent-je generálódik ki az oldalon, amit beolvas, majd ez kerül be a kereső indexébe, és jelenik meg a találatok között. Tehát ha Bing-el vizsgálok egy ilyen site-ot, akkor ott a Bing robotjainak IP címe és User-Agent-je jelenik meg, ha Google-el, akkor az övé. Nektek ugye elméletileg van saját robototok, bár Google User-Agent-el megy, ám az IP cím – mint az első vizsgálatnál is látszik – már kritikus, mivel továbbra sem hiszem, hogy annak a spoofolását ti meg tudnátok oldani.

Itt még annyit szeretnék hozzátenni, hogy látszólag próbáljátok ezeket a találatokat valahogy kimaszkolni, gyanúsan hiányoznak az IP címek a találataitok közül.

Jöjjenek tehát a képernyőképek
http://betteripaddress.com Szörcs, Google, és Bing találat:



Egyértelmű, hogy a Szörcs pontosan ugyanazt a snippetet adja vissza, pontosan azzal az IP címmel, amit a Googlebot kért le. Jól látható, hogy a Bing esetében a saját robotjának az adatait mutatja.

http://ip.cocodeo.hu Szörcs, Google, és Bing találat:



Ennél a példánál pedig azt láthatjuk, ahogy a Szörcs éppen a Bing találatát adja, a Bing robotjának az infóival. Ellenpélda a Google.

http://ipteller.com Szörcs, Google, és Bing találat:


Itt is gyönyörűen látható, hogy pontosan Google találatot adjátok vissza, ugyanazzal az IP címmel, amivel a Googlebot bejárta ezt az oldalt. Ellenpélda, Bing.

http://ipcimed.hu Szörcs és Google találat:

Bár itt nem pontosan egyezik a snippet, de látszik, hogy itt is egy Google IP címtartományból lekért találatot adtok vissza, Googlebot IP címmel.

Vannak még példák és screenshotok, de azt hiszem ennél több nem is kell, mindenki látja, és érti, mi a probléma.

Az lenne a kérésem, hogy a fent leírtakra (vizsgálatok, eredmények) adjatok magyarázatot, hiszen feltételezem, nektek is érdeketek, hogy az információhiányból eredő esetleges szakmai félreértések ne árnyékolják be a Szörcs image-ét, piaci sikerét. Remélem nem gondoljátok, hogy egyéni „hadjáratról” van szó, hiszen szeretném a korrekt tájékoztatás jegyében a témában érintett minden szereplőt megkérdezni, és a válaszok alapján egy hiteles, az ügy végére pontot tevő bejegyzést írni.

Kérlek Titeket, hogy 05.27.-ig küldjétek el válaszaitokat, és ha bármilyen kérdés merülne fel, keressetek bizalommal.

Üdvözlettel,
Türk István

Budapest, 2010.05.24

Címkék:


Kapcsolódó írások:

Október 1-től jön a BingBot, az MSNBot pedig nyugdíjba vonul
Furcsa 404
Szolgálati közlemény #ntv2009

72 hozzászólás "Szörcs with Google | Levél a Szörcs.hu fejlesztőinek"

1 | syck

2010. május 27. | 6:09 du.

Avatar

+1. Jo lenne vegre tisztazni, hogy mi az igazsag.

2 | Szörcs

2010. május 27. | 6:13 du.

Avatar

mosquito, ide is leírom amit neked írtam Gtalkon:

Májusban sávszél problémákkal küzködtünk, ezek egyébként jelenleg is fennt állnak, ezért akadozik a szolgáltatás.
Ezt úgy próbáltuk meg – bevallom, szakmailag megkérdőjelezhetően – kitrükközni, hogy egyes esetekben, amikor a felgöngyölített, de még nem beindexelt oldalt lekértük, és nem válaszolt 3-4 ms-en belül; hogy lekértük más keresők tárolt változatát. Ennek előnye, hogy ugyan azt a tartalmat tömörebben és 0.2 – 0.5 s alatt megkaptuk.
A fent leírt furcsaságokat ez okozta.

Ha a szakma ezt elítéli, akkor nyilvánosan fogunk elnézést kérni.

Várjunk a véleményeket.

3 | Halo

2010. május 27. | 6:17 du.

Avatar

grat istván, végre valaki leírta, amit a szakma komolyabbik fele, már régen tud. még biztos lesz maszatolás meg magyarázkodás. ilyen ez a csapat.

4 | tantusz

2010. május 27. | 6:18 du.

Avatar

A tárolt változatok lekérése sok esetben lassabb mint ha az adott oldalt töltenénk le. Ez szerintem gyenge kifogás.

5 | Halo

2010. május 27. | 6:19 du.

Avatar

ja és ez óriási FAIL a szörcstől.

6 | adoayen

2010. május 27. | 6:23 du.

Avatar

Ez izgalmas meccs lesz.

7 | iSandor

2010. május 27. | 6:30 du.

Avatar

Epic fail. Szörcs must die.
Szánalom. Semmilyen “sávszél problémák” nem indokolják a paraszt magatartásukat. Pont.

8 | Bazsi

2010. május 27. | 6:48 du.

Avatar

Turmix crawler. Annyit nézem az helyezések változását, hogy a napokban letiltotta a google az ip-met, azt hitte vírus dolgozik a gépemen. Amíg nem lettem biztos benne, hogy csak crawler, a szörcsön is elég sokat néztem. pont akkor esik vissza, pont akkor indexálódik, pont az a beindexelt session. DE ha mégsem lenne az. akkor is minden ugyan úgy csinál, mint a google, csak lassabban.. szal #minekvan

9 | tantusz

2010. május 27. | 7:22 du.

Avatar

Remélem én is, hogy vigyáz magára. Sajtos azt hiszi mindent megtehet? De a hazudozást nagyon jól csinálja, én pl simán elhittem, hogy saját indexeik vannak (a meetupos videóban jól előadta magát).

Remélem erre postra egy nagyobb lap (origo – index) is felfigyel… kellene…

10 | mosquito

2010. május 27. | 8:07 du.

Avatar

Pls. mas ugyeket, serelmeket ne ide, maradjunk a szakmai reszenel. Ami nem ide illo volt kiszedtem, ez igy korrekt.

11 | majke

2010. május 27. | 8:15 du.

Avatar

LOL:

“SI: Nehéz megmondani. Nyilvánvalóan az esetek döntő többségében nem tudatos választásról van szó. Ma már rossz keresők nincsenek. Mindenki azt használja, ami neki kényelmesebb, vagy amit épp az orra alá tesznek. Ha holnaptól a Google a mi találati listánkat adná vissza egy Google logó alatt, senkinek nem tűnne fel.”

via: http://www.webforgalom.hu/blog/sajtos-istvan-szorcs

12 | notavailable

2010. május 27. | 8:38 du.

Avatar

Elkezdték szörcs & riplésszel kijavítani a találatokban az idegen IP címeket a sajátjukra. Nem túl elegáns megoldás, mert hosztnevet elfelejtették lecserélni és megmarad a yahoo crawlere:

http://img413.imageshack.us/img413/3596/szorcsendriplesz.png

13 | Bazsi

2010. május 27. | 9:18 du.

Avatar

Egész egyszerű.. :)
Csinálok egy új oldalt, apacheban bannolok minden ip-t a google tartományain kívül. Ha megjelenik a szörcsben, az gáz. Ja nem, mert néha “lekérik”. 10 oldalt csinálok így. Ha mind a 10 megjelenik, akkor a “néha” rész megkérdőjelezhető?

14 | zsolt

2010. május 27. | 9:46 du.

Avatar

Már egy 2009 júliusi cikkben is szó volt arról, hogy Googlebot-nak maszkolják állítóllag a crawlerüket, szóval ez a “májusban sávszélproblémánk volt” elég gyenge kifogás. Mikor először megláttam szimpatikus volt a kereső, de most nagyot csalódtam… Egyébként azt hiszem régebbi blogbejegyzésekben is szó volt arról, hogy jelenleg még Googlebot-ként járják a webet, de a blog régebbi bejegyzései érdekes módon eltűntek.

15 | Cseh Balázs

2010. május 27. | 10:45 du.

Avatar

Hát ez kellemetlen. De miért kell így elrontani a dolgokat? Mármint nem a cikk, hanem a maszatolás a szörcs részéről? Úgyis mindig minden kiderül, aztán főleg online-ban meg megy tovább minden csatornán és csak a kellemetlenség van belőle.

16 | tantusz

2010. május 27. | 11:32 du.

Avatar

Egy régebbi seoblog bejegyzés a Szörcsről innen a seoblogról: http://www.seoblog.hu/keresok/elstartolt-a-szorcs-hu/
Érdemes elolvasni ott is a hozzászólókat, hasonló probléma mint most ott is kitárgyalásra került.
Nagy respect+ mosquitonak, hogy tisztán a szakmai kérdéseket szeretné tisztázni, teljesen objektív formában, a seoblog az seoblog.

17 | Sári Márton

2010. május 28. | 3:52 de.

Avatar

Jézusom, amit @notavailable mutat, az botrány. Kedves Szörcs! Mi magyarázza azt a search and replace trükközést? Erre nagyon kíváncsi vagyok.

18 | DuracellTomi

2010. május 28. | 7:38 de.

Avatar

Kíváncsian várjuk a választ. Egy beismerés talán jobban jönne, mint a további maszatolás.

Érdemes rákeresni amúgy a szorcs.hu-n például ilyenre: http://szorcs.hu/keres/sz%C3%B6rcs+google/1

19 | bano

2010. május 28. | 10:13 de.

Avatar

@Szörcs: jelzem, a szakma ezt elítéli, illetve aki nem ítéli el, az nem tekinthető szakmabelinek.

Kigurulni egy sajátnak hívott autóval, amin az autószerelő-szakma nyilvánvalóan látja, hogy a motor Merci, a kasztni Audi – hát legalábbis erősen korlátos projekt, hiába van felmatricázva.

Ezek az autószerelők sok-sok éve dolgoznak ilyen autókkal, és 10 queryből megfelelő pontossággal megmondják, hogy mely keresők milyen mixeit látják.

Oké, értjük, persze, más snippetek meg csiripek is vannak meg minden, de a legértékesebb információ, egy keresőgép zanzája, éltető ereje és legfőbb minőségi jelzője, az ALAPADAT és abból FELDOLGOZÁSSAL következő adott RANKING (<- pongyola megfogalmazás alert) nekem egy csomag összekevert magyar- és tarokk-kártyapaklinak tűnik, amivel pókert próbálunk játszani.

20 | ern0

2010. május 28. | 10:45 de.

Avatar

Én, ha keresőt csinélnék, biztos elkövetnék stikliket, pl. feltápolnám az URL-adatbázist kurrens kifejezésekre adott Google találati listákban meg mindenféle katalógusokban szereplő URL-ekkel… de ez így gáz, Amúgy csatlakozom @bano-hoz: ha nincs saját fetch, meg processing, ranking, akkor egy kereső #minekvan

BTW tényleg nem értem a dolgot, mert egyébként egy jó Google-mashupnak is volna értelme, vagy metakeresőnek, és még van pár műfaj.

21 | ownage

2010. május 28. | 10:52 de.

Avatar

Hogy lehet a google kereső mező alá rakni azokat a legördülő menüket? (anytime, any language, any file)

22 | MárkaJani

2010. május 28. | 11:02 de.

Avatar

Érdekes történet!

24 | ownage

2010. május 28. | 1:31 du.

Avatar

hasznaljatok a bluu.hu-t :D ne ezt a fost, még a neve is idegesítő

25 | lol

2010. május 28. | 1:49 du.

Avatar

A befektető arcára lennék kíváncsi, aki a Szörcs fejlesztését támogatta. Legalábbis azt hallottam van a háttérben.. :)

26 | kobayaschi

2010. május 28. | 2:01 du.

Avatar

Szerintem ennyi erővel csinálhatnának saját index-et is. Csak gondolom már megint a pénz és az idő ezt nem engedte. :(

27 | Woo

2010. május 28. | 2:54 du.

Avatar

Kedves hozzaszolok,

Az a gond, hogy ez egy ceg, ami probal megelni. Munkahelyek, stb.. Segiteni kellene nekik, helyes utra iranyitani oket es nem a sarga foldig leanyazni es veruket venni.
Hibaztak, lebuktak. Mostantol sokkal-sokkal-sokkal jobban oda kell figyelniuk es meg kell probalni felkelni a foldrol es oszinte hozzaallassal megprobalni visszaszerezni az embereket.

A kerdes, hogy kepesek-e erre es kepesek-e azt mondani, amit a bizonyitekok es kepesek-e megigerni es betartani, hogy mostantol a sajat utjukat jarjak indexelesben.

Szerintem. De rugdosni a foldon fekvot, akkor sem kell es nem is szep dolog.

Woo

28 | Winya

2010. május 28. | 3:06 du.

Avatar

@Woo
Utólag nehéz keresőszolgáltatás alá keresőindexet tolni. Ezt a startup előtt kellett volna, ahogy erről szó is volt. Most úgy látszik melegszik a talaj a lábuk alatt, és nem megfelelően reagálnak az eseményekre. Nem lesz ennek jó vége.

A szörcsnek meg csak annyit üzennék, hogy ha sávszélesség para van, akkor nem cache-t kéne használni mókányolás helyett? :)

29 | Cseh Balázs

2010. május 28. | 3:49 du.

Avatar

@Woo: hát… nem…

nekem ez olyan, mintha mondjuk egy cég korrupcióba keveredne, és azt mondanánk, hogy nézzük már el nekik, mert munkahelyek, stb. és hadd kezdjék újra…

hát izé… átverés és más pénzével/jóhiszeműségével, visszaélés, stb. Vagy adják vissza a pénzt mindenkinek, akitől pénz származott feléjük, és kezdjék újra. Na igen, úgy igen! Mert máskülönben hadd ne sajnáljak valakit, aki visszaél a bizalmammal.

30 | tantusz

2010. május 28. | 3:58 du.

Avatar

A Blog szerzőjének üzenem, hogy többen félreértik a postot. A Hwsw-n is ilyen címmel jelent meg: “A Google lenyúlásával vádolják a magyar keresőt” ami szerintem nem helytálló, hiszen a szerző nem vádol, hanem szakmai kérdéseket szeretne tisztázni, néhány bizonyítékkal alátámasztva a számára fontos témákban. A kettő pedig nem ugyanaz.

@Woo: Cseh Balázs véleményével értek egyet én is.

31 | MárkaJani

2010. május 28. | 3:59 du.

Avatar

@Endre Bátori: Az a durva, hogy a róluk szóló, negatív tartalmakat cenzurázzák. Nyoma sincs a keresőjükben ez a téma.

32 | lipilee

2010. május 28. | 4:08 du.

Avatar

@Woo, a problémának csak az egyik része, hogy “hibáztak” (ie. nem legális módon működtetik a szolgáltatást).

ilyen kis közösségben, mint a magyar, a nagyobb probléma a helyzet kezelése, persze feltéve, hogy valóban az a szitu, amire a bizonyítékok következtetni engednek. az, hogy kamuzással, (relayelt) keresési eredmények szűrésével és kozmetikázásával vélik megtalálni a megoldást, na az kurva ciki.

mondom, ha tényleg hibáztak.

33 | syck

2010. május 28. | 4:12 du.

Avatar

@Woo meglehet elni szelhamoskodas nelkul is.

ha talalnak egy befektetot aki belerak par tiz milliot, majd hirtelen elzarulnak a yahoo, bing, google csapok, mi tortent volna? ki bizott volna az eset utan a magyar startupokban?

ez nem egy gyerekcsiny, vagy apro kis botlas amit csak el lehet intezni egy bocsnakat keressel…

sokak erzik atverve magukat, en is. az elejen meg drukkoltam nekik, biztam bennuk. szimpik voltak, de egyre inkabb ugy tunik, h tudatosan vertek at mindenkit :(

34 | szvsz

2010. május 28. | 4:36 du.

Avatar

A Sajtos csávó írt egy blogbejegyzést a szörcsblogon. Csak magyarázkodik és mellébeszél.

Arra a felvetésére, hogy a google kitiltaná az IP -jét, ha minden szörcsös keresés a google -ből származna, cáfolatként azt tudom mondani, hogy valószínűleg proxy -t használnak. (X lekérés után egy állandóan up-to-data proxy szerver lista következő címével maszkolja el magát a szörcs szervere a google felé)

35 | Kop

2010. május 28. | 4:45 du.

Avatar

http://szorcs.hu/blog/szorcs.szorcs/nyilt-level-az-it-szakmanak/

Elolvastam a vádakat és kommenteket is. Nekem továbbra sincs bajom a szörccsel. Nem a korrektségre vagyok kíváncsi, hanem a keresési eredményekre, amiket bizony tud produkálni. Hogy milyen módon, az az ő dolga. Nem értem, mirefel ez az egész balhé.
Mellesleg hiszek Zerkingnek, nem olyan fajta srácnak tűnik, aki csak arra vár, hogy meglépjen ciprusra az összekaszált zsével.

36 | Bazsi

2010. május 28. | 5:01 du.

Avatar

Már korábban is írták. Semmi baj nem lenne vele, ha nem saját keresőnek lenne beállítva. Úgy akár a legjobb lehetne a kategóriájában.
http://kereses.blog.hu/2010/01/28/hogyan_keszult_szorcs
A fenti link egy interjú. Az egészben egyetlen egy szmájli van, a “válaszadó” részéről. Nekem csak ez a bajom vele. A kékről átszellemült arccal állítják, hogy piros és a végén én érzem hülyének magam, pedig tudom, hogy kék.
http://szorcs.hu/blog/szorcs.szorcs/meetup-eloadas/ a videóban is “látható” az a szmájli, amikor a robotról van szó.

37 | monsta

2010. május 28. | 5:09 du.

Avatar

@35: Sajnos nem az o dolga, hogy milyen modon, amennyiben ezzel jogsertest kovet el es merheto anyagi kart okoz masoknak. Jogsertest kovet el, mert egyertelmuen megszegi az adatforrasok TOS-at, es anyagi kart okoz azzal, hogy az eredeti talalati listaban levo hirdetesek mennek a levesbe. Nem kivanom nekik, de ha az ilyen monstrumok mint a Google meg az MS felebrednek erre es jogi utra terelik a dolgot (akar csak peldat statualni), akkor a Szorcsnel ko kovon nem marad. Aztan lehet majd sajnalni szegeny magyar startupot (persze csak ha valaki kizarolag unnepnapokon mozgatja meg az agyat) akit kicsinaltak a rohadt multik. Emellett az atbaszott felhasznalok hangulata smafu.

38 | tantusz

2010. május 28. | 5:38 du.

Avatar

@35: Ez hihető lenne abban az esetben ha egy régi seoblog hozzászólói nem ugyanezt a problémát fejtegették volna.
Sajnos ez mellébeszélés, hiszen ez egy olyan válasz ami a Seoblog megkeresésére maximum 30 perc alatt meg lehetett volna adni, ehelyett eltüntették a bizonyítékokat és 27.-éig nem válaszoltak a megkeresésre.
Ráadásul egy másik srác beszólt nekik (ugyanezért) és kárt okoztak neki, ami miatt Sajtos mestert a rendőrség hallgatja ki.
Egyszerűbb lenne beismerni mint hazudozni…
Másrészt ha másik keresőt használnak és azok tiltanák az ipjüket, akkor a tárolt változatnál nem tiltják? Mert napi több 10.000 keresésnél inkább ki lehet kerülni a tiltást mint mondjuk több százezer vagy akár több millió weboldal tárolt változatának lekérésekor.
Csak én látom így, hogy hülyének néznek mindenkit?

39 | Outsider

2010. május 28. | 7:01 du.

Avatar

Sziasztok,

én nem vagyok szakmabeli, de ha igaz, amit a nyílt levél tartalmaz, szigorúan saját álláspontom szerint, szerzői vagy szerzői joghoz kapcsolódó jog megsértése (mert az adatbázisok létrehozóit is megilleti ez a jogvédelem, és szerintem egy index v. találati adathalmaz is adatbázis, de ezt ti értitek, én csak tippelek), illetve, de nem feltétlen, halmazatban csalás, ha pl. befektetője van, aki úgy áldozott pénzt a projektre, hogy végig tévedésben tartották, lévén nem saját szellemi termékről van szó.

Üdv, és bocs, hogy beleugattam.

40 | dave

2010. május 28. | 7:19 du.

Avatar

A szörcs óriási hibát követett el, hogy NEM MONDTA EL:

1. Szerzői jog: a szörcs elvileg csak felhasználja a google, yahoo, bing találatait, és nem pedig reprodukálja. Ez alapján védhető.

2. Befektetőként egy mashup sokkal olcsóbban és kisebb kockázattal üzemeltethető, mintha valóban kéne szerverpark, crawler, stb.

42 | csótány

2010. május 29. | 12:13 de.

Avatar

41 | Endre Bátori

no comment…

43 | monsta

2010. május 29. | 12:55 de.

Avatar

OFF: minden flamewart szigoruan megprobalva elkerulni, de most komolyan: mysql? a so-called szakertoi gardat megvesszoznem izombol. nemtom sirjak-e vagy nevessek. hosszu tavra terveztek…

44 | Endre Bátori

2010. május 29. | 1:57 de.

Avatar

http://www.overstream.net/view.php?oid=l0ebn9m9mfah

Csak hogy legyen passzoló tartalom a tegnapi “karikatúrámhoz”.

45 | monsta

2010. május 29. | 2:54 de.

Avatar

A 43as OFF helyett most egy megaOFF, szigoruan szakmai (programozoi, nem SEO) szemmel. Vettem vegul a faradsagot, hogy vegignezzem a video prezentaciot (http://szorcs.hu/blog/szorcs.szorcs/meetup-eloadas/), konnyesre nevettem magam a vegeredmenyben semmit sem mondo kormondatokon, a technikai csusztatasokon, meg ugy altalaban az eloado es a prezentacio sulyos szakmai hiteltelensegen.

00:20: “tobb tucat specialista, nyelvesz es adatbazis specialista vett reszt a fejlesztesben” (errol kesobb.)

00:48: “nincs egy olyan kiforrott platform, nincs egy olyan technologia es kornyezet, ami 100%ig kielegitene a szorcs.hu igenyeit” (nemar, nincs dobozos ‘search engine for lazy startups 2.0′ a boltban? sokkolo felismeres lehetett.)

00:57: “architekturalisan 3 reszre oszthato blabla. crawler omleszt adatbazisba, frontend meg keres adatbazisban” (ezt meg elhinnem, hogy a hallgatosag vegyes osszetetele miatt egyszerusiti le ennyire, de pl google eseteben ott a MapReduce, ami egy elegge nem elhanyagolhato resze egy ekkora adatmennyiseggel dolgozo elosztott megoldasnak, ami ott all a frontend es a fel magyarorszag meretu adatbazis farm kozott. kiveve persze ha fogsz egy marek ‘php 24 ora alatt’-on nevelkedett mysql buvart, aki ket kezzel szorja a select *-ot, az biztos kompetens megoldast szul. elkepeszto szakmai pongyolasag.)

01:30: “adatbazis szinten mysqlt, postgresqlt es memcache alapu technologiakat hasznaltunk.” (lasd 00:20: magara valamit is ado vezeto fejleszto itt kezdi a dunaba loni a tobb tucat adatbazis specialistat, a heterogen sql szerver otlettel egyetemben. sirok, de most komolyan. ijeszto fercmunka szaga van.)

01:37: “a kiszolgalas alapvetoen egy instant php.” (mi a tokom az az instant php? mitol instant? mivan?)

02:50: “ha kiirnank a szorcs teljes adatbazisat, csupan a hetedik emeletig erne fel.” (Last #41, nalam 32 giga elfer 7 dvdn. bar ketsegkivul rakhatok minden emelere 1 azaz egy darab dvdt, akkor pont kijon, de akkor a foldszint kimarad.)

03:30: “masok is siman megoldjak, hogy petabytenyi mennyiseg feletti adatban tudjanak keresni.” (hat ezzel a komoly ervvel engem most meggyoztek teljesen. ha masok is, akkor nyilvan barki, csipobol. halleluja.)

04:54: “ugye az internet alapvetoen nehany technologiara epul: megvannak az adatbazis szerverek, megvannak a tartalomkezelo cmsek.” (masbol nem is all. mar ez az internet. tcp/ip kit erdekel, routing kit erdekel, dns hulyeseg, parszaz protokoll RFC-je bagatell. cms van meg adatbazis. that’s all folks.)

05:17: “blog.hu fikazas, redirectek, nehezsegek.” (noaszondom `wget http://szalonspicc.blog.hu/2010/05/28/no_most_akkor_ki_is_az_ellen`. 1 redirect, 2 redirect [tenyleg redirectel], majd dobbenj meg lejon a content. de kurva nehez volt atspoofolnom magam a useragent vedelmen. kapitalis felfujt faszsag az egesz.)

08:00: “a miner az egy vertikalis kereso, bar van mogotte egy Bing mostanaban, ugy vettem eszre.” (no comment. ja de megis: fuj! csalok!)

08:15: “a Bluu-t meg nem lattam.” (komoly, ha a sajat trivialis konkurenciaidat meg se nezed, hiheto.)

08:34: “konnyebb felismerni, hogy mi az hogy szemet, mint mi az, hogy tokjo.” (ez elegge biner dolog, barmelyik osztalyozas felismeresebol kovetkezik az ellentetes osztalyozas felismerese is.)

Raadasnak egy gyongyszem a Szorcs blogrol: “És a Miner is jobb lesz, hiszen ők Szörcs motorra állnak át általános kereséseknél, eldobva a nagy gonosz multi által rájuk sózott eddigi rendszert.” (es megkapjak helyette ugyanazt + meg masik kettot ;))

Somma sommarom, mindezek utan en elhiszem, hogy ok egyszer regen keresomotort kezdtek fejleszteni. Szuk eroforrasokkal es kompetenciaval, ugy jo parasztosan, a bal felso sarokban elkezdve. Aztan hamar leesett, hogy ez nem annyira konnyu, mint elsore latszott, ekkor csaphatott at a projekt a huszarvagasos “piocazzuk meg azokat, akiknek mar sikerult” hadmuveletbe.

46 | SubZtep

2010. május 29. | 5:20 de.

Avatar

Rakerestem a sajat nevemre a szorcson es a googleben (.com, .hu), a szorcs megjelenitett olyan talalatokat ami nem volt a google listajaban. Mellesleg a google keresoje eleg hamar kitilt ha egy ip cimrol kezdik el floodolni, komoly proxylistaval kell rendelkeznie a szorcsnek ha tenyleg onnan huzzak az adatokat. (nem ismerem a hatteret)

47 | Zsolt

2010. május 29. | 12:28 du.

Avatar

@46: igen már szó volt arról, hogy vannak azért benne saját tartalmak is, a gond azzal van, hogy ez egy kis része a dolognak, a többit más keresőktől lopták, engedély nélkül, és ezt fel sem tűntették. Továbbá ezt az egészet úgy futtaták, hogy teljesen saját fejlesztés. És ne feledjük azt sem, hogy átvertek jópár embert, a felhasználóikat, -és ha vannak, akkor – a befektetőiket is.
Gondolj bele milyen lehet ha befektetsz valamibe amiről aztán kiderül, hogy kicsit másképpen működik mint ahogy azt neked beállították, és hála a ferdítéseknek, mindenki bizalmatlan lett az adott szolgáltatással szemben.

48 | jézusom

2010. május 29. | 1:21 du.

Avatar

Ezek még az “ajjaj”-t se tudják helyesen leírni. Gyász.

49 | Pólik Imre

2010. május 29. | 1:56 du.

Avatar

Kint van a poszt a hvg-n, ilyen ajánlással: “Év elején indult el hódító útjára a Szörcs.hu kereső, ami teljes egészében magyar fejlesztés.” Ezek után elég nagy meglepetés volt elolvasni a posztot.

50 | Pólik Imre

2010. május 29. | 2:23 du.

Avatar

Kint van az előző poszt a hvg-n, ilyen ajánlással: “Év elején indult el hódító útjára a Szörcs.hu kereső, ami teljes egészében magyar fejlesztés.” Ezek után elég nagy meglepetés volt elolvasni a posztot.

Időközben eltűnt az index.hu aljáról a szörcs-reklám (szavazz a szörcs.hu háttérképére). Vagy csak lezárult a szavazás?

51 | Woo

2010. május 29. | 10:07 du.

Avatar

Hm. Izé.. Azt hiszem kicsit félreértették páran amit írtam és azt hiszik szerecsent akarok mosdatni, pedig nem. Értem én, hogy hibáztak és ejnyebejnye, de valahogy mindenki folyton megáll ennél a ponton, amit keveslek. A baj megtörtént kellene valami MEGOLDÁS. De egyelőre csak a vérben szeret tapicskolni a többség és kész én pedig ezt a hozzáállást kicsit idejétmúltnak gondolom. Sosem elég a problémára rámutatni.

Woo

52 | mosquito

2010. május 29. | 11:28 du.

Avatar

Woo, erkezett egy valasz, amit vagy elhiszunk vagy nem. En tovabbra sem latom viszont a levelemben feltett alapkerdesre a valaszt a Szorcs reszerol. Ha en szeretnem tiltani a Szorcs botokat – mert elkepzelheto, h akarom -, akkor azt hogyan tehetem meg anelkul, hogy a Google vagy a Bing/Yahoo botjait is tiltanom kellene. A problemara ra lett mutatva, de a Szorcs reszerol egyelore magyarazkodast erzek csak, nem pedig problema megoldast.

53 | AnarchoiD

2010. május 30. | 1:02 de.

Avatar

Olvasom a hozzaszolasokat, es jo latni hogy a magyar mentalitas nem szunnyad ;)

Capak es piranyak koroznek a biliben ;)

54 | Zsolt

2010. május 30. | 10:31 de.

Avatar

Mindig van egy-két ilyen aki beírja ezt, de úgy látszik akkor fogalmad sincs az egészről. Teljesen jogosan háborodott fel mindenki, ez nem “magyar mentalitás”.

55 | Kinga

2010. május 30. | 11:30 de.

Avatar

@53: mivel Sajtostól még mindig nem hallottuk az igazat, naná, hogy aki tud, bizonyítékokat keres. Nem ez a kis magyar, hanem a Szörcs.
http://www.youtube.com/watch?v=h4wjQrV5A1c

56 | Outsider

2010. május 30. | 9:33 du.

Avatar

Szerintem is inkább #53 hozzáállása a rossz értelemben vett “hagyományos” magyar. Ne merje senki kritizálni a mi kutyánk kölkét, mégha kicsit sárga, savanyú és -lehetséges, hogy- nyúlás is, na ez aztán haladó gondolkodás.

Bár Anarchoid névvel lehet, hogy we have just been trolled.

58 | TheElf

2010. június 1. | 5:17 du.

Avatar

Az egyik alapkérdés: Van-e értelme keresőnek saját botok nélkül? Azt hiszem a válasz egy kicsit összetettebb.

Tény, hogy a keresési eredmények megjelenítése nem a legfontosabb egy kereső életében, inkább a rangsorolás a fontos.

Ha valaki a Google, a Bing, a Yahoo indexeit is használja, de pl. a vírusos oldalak kiszórásánál is több adatbázist használ, APIn keresztül kommunikál Twitterrel, Facebookkal, és így egy oldal ottani említéseire jobban reagáll…

A több információforrásnak köszönhetően jobban értékeli az oldalakat minta riválisai, relevánsabb találatot ad, stb. akkor van értelme.

És a meglévő meta keresőket sem fogod kizárni.

Ha mindezeknek mellett a keresési trendeknek, twitteres trendeknek a figyelembevételével a legfontosabb oldalakat saját spider is elemzi (kizáni a malware-t, jobb nyelvi elemzés segíti a jobb találatot) ergo van egy saját index, de az kicsi, akkor szintén életképes keresőt kapnánk.

A kérdés nem csak az, hogy a szörcs rendelkezik-e saját indexxel, használ-e ezek mellett külső keresőktől érkező adatot, hanem az, hogy van-e az oldalak rangsorolására egy versenyképes algoritmusa. Ha lenne biztos ezzel védenék meg magukat és nem magyarázkodással takaróznának.

59 | Tim Robbins

2010. június 2. | 9:05 de.

Avatar

azert brutalis, h a kockageek olyannyira kockageek, h nem latja a fatol az erdot :)
az _egyik_ fo erv a csunyabacsik ellen h atb@sztak a felhasznalokat. hat latom senkinek nem tunt meg fel, de:

A felhasznalot KURV@RA nem erdekli, h milyen crawler, db meg egyeb technikai hatter van egy kereso mogott. Annyi erdekli h ha beirja a kw-t akkor szamra a letezo legjobb talaltokat kapja.

a szorcs.hu, max a szakmat b@szta at (ha egyaltalan).
az meg kit erdekel.

60 | monsta

2010. június 2. | 10:24 de.

Avatar

@59: ez azert eleg primitiv altalanositas. olyan mintha azt mondanad, hogy senkit nem erdekel, ha Szoke Cica mindig playbackre tatog, mikozben Barna Muci eneket torzitottak meg minden szamahoz, az o tudta nelkul, es Cica minden interjuszereplest megragad, hogy a sajat hangjat fenyezze. valoszinuleg lesznek paran, akik csalodnak benne, ha kiderul a turpissag, nem csak a kiadoja meg Barna Muci lesznek morcosak.

persze lehet, hogy tevedek, es az elmult heten keszitettel egy reprezentativ felmerest ezugyben, es annak az eredmenyet publikaltad az elobb.

de meg ha igy is lenne, akkor sem mentseg, hogy a celcsoportodat nem erdekli.

az orgazda vevoit sem erdekli, hogy honnan a cucc, aztan megis buntetik. vagy nem kene? vegulis csak a tulajdonost meg a yardot zavarja, ami elhanyagolhato kisebbseg.

a szo amit javaslok felvenni a szotaradba: etika.

61 | Tim Robbins

2010. június 2. | 2:22 du.

Avatar

@60: vmit felre tetszik erteni, de nagyon. nem azt mondtam, h ez helyes cselekedet volt. nem, nem az. etikatlan, erkolcstelen, itt-ott jogserto esatobbi (_HA_ arrol van szo amirol !!!)

en arrol beszelek, h ez melysegeben kb a kutyat nem erdekli. vihar a biliben.
megegyszer: (_ha_) atb@szas tortent, akkor a kov csoportok erintettek:
1. user
2. szakma
3. befektetok
4. jogsertest elszenvedok.

ezekbol az 1. , mint legvastagabb reteg, magasrol leszarja mindezt. nem erdekli h az SE alatt mifele motor dolgozik (ha ezzel ujat mondtam, akkor joreggelt kivanok, de azert csaknem ;) )
a 2.-t magasrol lesz@rja a tobbi reteg (el nelkul: mikoze hozza). a 3.-4.nek pedig van koze a temahoz, de egyenlore meg nem hallottuk oket mozgolodni.

hat en ugy hallom/olvasom, h pont a 2. kiabal, mikor ok a legkevesbe relevans talalati lista.

szal geekvihar a biliben…

62 | monsta

2010. június 2. | 3:54 du.

Avatar

@61: ez egy szakmai blog. mit vartal ki fogja itt a velemenyet kifejteni a temaval kapcsolatban?

tovabbra sem talalom bizonyitott tenynek, hogy a felhasznalok 100%-at ez nem erdekli, ez a te minden alatamasztast nelkulozo privat feltevesed.

de ha meg igy is van sem kell, hogy befolyasolja a szakmailag erintett latogatokat abban, hogy velemenyt nyilvanitsanak vagy sem.

ha a szorcs iroda elott tuntetnenk transzparensekkel, az jokora vihar lenne a biliben, addig is szakmai velemenyt nyilvanitunk kifele egy szakmai blog hosszaszolasai kozott, ami nem tunik annyira meglepo fordulatnak a korulmenyeket tekintve.

63 | Sheron

2010. június 2. | 4:53 du.

Avatar

Nem tudom de nem veszi észre észre senki, hogy ez az egész nem arról szól, hogy végfelhasználó mennyire érintett a dologban?

Tök egyértelmű, hogy Pálfalvayi Rozáliát a dolog rohadtul nem hatja meg. Ha a dolog lényeg az ő átvágásukra ment volna akkor tények, napló esetleg Trutykós Trutykó (a kopasz kimondhatatlan nevű figura aki beszélni nem tud) foglalkozna a dologgal.

Én nem alkotok véleményt a dologról mert közöm sincs hozzá de Ti itt fenn eléggé partvonalon beszélgettek a témáról.

A vihar érdekes, jó látni, hogy szerencsére ma már nehéz ólmot eladni aranynak álcázva és ha ez az egész másra nem volt jó arra biztos, hogy az elkövetkezendő időkben felbukkanó startupok, megfelelően odafigyelnek a kommunikációjukra.

Sheron

64 | Tim Robbins

2010. június 2. | 7:33 du.

Avatar

@62: legyel szives menj oda, h iwiw.hu. aztan irj be a searchbe BARMILYEN nevet. istvan, maria, tamas, AKARMI.

aztan vedd elo a kepzeloerodet (marhogyha van, bar ezen megnyilvanulasok alapjan en ezt erosen ketlem), es gondolj mar bele, h az adott kepen szereplo egyent vajon erdekli-e, h adott kereso mogott milyen motor lakozik?
elarulom: KURV@RA NEM FOGJA ERDEKELNI ! sot, fingja sem lesz arrol h miaz h SE motor…
ha te szakmabeli vagy es ezt nem igy gondolod, javaslom minel elobb valtoztass szakmat. pl. fuvet nyirni tudsz-e ? en most keresek kerteszt. komo!

65 | monsta

2010. június 2. | 10:37 du.

Avatar

@64: ha nem tunt volna fel, ez nem az “atveri-e a szorcs a felhasznaloit” bejegyzes, hanem a “nyul-e mas keresoktol talalati listat es hiheto-e, hogy sajat crawleruk van” bejegyzes. emiatt a felhasznalok erdektelenseget firtato velemenyed egyreszt teljesen irrelevans, masreszt tovabbra sincs alatamasztva semmivel, azon kivul, hogy szerinted igaz. ha ezeket a trivialis tenyeket nehezedre esik megemeszteni, akkor javaslom nyird le inkabb a fuvet a kertedben, hatha lehiggadsz kozben. reszemrol ezt a meddo vitat lezartam.

66 | Tim Robbins

2010. június 3. | 11:32 de.

Avatar

@65: ideznek a post irojatol:
“Megvezeti a felhasználókat és a szakmát.”

szoval DE, ez egy “atveri-e a szorcs a felhasznaloit” bejegyzes IS.

emiatt mereszkedtem reagalni a fenti mondat ket allitasara:
1. felhasznalot nem erdekli
2. szakmat meg talan erinti talan nem (mivel nem tudjuk perpill h igaz-e az allitas), de mivel a szakma tizenhusz emberbol all, ezert ez kb lenyegtelen kategoria.

ergo: vihar a biliben.

67 | Benbe

2010. június 3. | 7:58 du.

Avatar

@Tim Robbins: igen, megvezeti a felhasználókat. Ők ugyanis arra számítanak, hogy mélyebben és értelmesebben merít a kereső a magyar webből, viszont a közös crawler miatt (mivel saját crawlert még senki nem látott) várható, hogy a merítése a szorcsnek legfeljebb akkora lehet, mint a google-é. Ami mondjuk a Bingéhez viszonyítva elég nagy, de összességében a magyar webre nézvést elég halvány.

Másrészt a crawler ugye az egyszerűbb része a keresőknek, a rangsorolás és az eredmények előállítása a nehezebb. Tehát egy felhasználó gondolhatja, hogy a szorcs okosabban válogat, de ha ilyen lámák írják, akkor az is lehet, hogy nem. Ez pedig már nagyon is érinti a felhasználót.

A legfontosabb pedig, hogy a felhasználót igenis érintik a csalások, akár egyszerűek, akár bonyolultak. Egy keresőben ma feltétlenül megbízik minden netező. Amit egy kereső eredményül ad egy kérdésre, azt fogadjuk el válaszként. A szorcs ma egy tizes skálán mennyire megbízható? Nem technikailag kérdezem, hanem szubjektíven.

Tulajdonképpen a szorcs a cikkben leírtak alapján egy “metakereső”. A metakeresők pedig valamiért soha, sehol nem futottak be. Leginkább a felhasználók preferenciái miatt.

68 | trükkös bélabá

2010. június 6. | 1:57 du.

Avatar

betteripadress.com ra mostmár hiába keresek rá, nincs találat, kiszűrték, ne h látszódjon.

69 | Ilyen a magyar kereső, avagy a Szörcs botrány! | PC blog

2010. június 16. | 12:44 de.

Avatar

[...] a Szörcs, és a Bluu nevével, ha máshol nem, hát itt a blogon mi is írtunk róla. A botrány ezzel a bejegyzéssel kezdődött el. Az írás részletesen, és mélységeiben elemzi azt, hogy a [...]

70 | krutek iatván

2010. augusztus 1. | 11:40 de.

Avatar

Elvesztek a janúártol irt kapott leveleim,,nem ad be levelezési óldalt Mi az ördög tőrténik ijenkor ÚÚÚÚJJJJJ
reklám oldalak..soha de soha*
Álliztsák visza azonnal mert fóntós ügy íratok..Googhle..levelek..krutekpista..

71 | PopcornHero

2010. augusztus 16. | 10:57 du.

Avatar

nem az első, és nem az utolsó… sajnos.

ugye nem csak én látok e kettő közt hasonlóságot?

http://www.mocsokmacsok.hu/

http://www.AskMen.com/

72 | PHP/MySQL fejlesztő

2010. augusztus 17. | 7:23 de.

Avatar

Az etikai/jogi részével nem akarok foglalkozni. Én személy szerint elítélem őket, mert nem írták ki, hogy honnan származnak a találataik, de ezen senkivel nem akarok vitatkozni. A jogi részét meg rábízom a Google-re, Bing-re és a Yahoo-ra. A szakmai részhez szólnék hozzá.

Több, mint 15 éve fejlesztek PHP/Apache/MySQL kombinációban, úgyhogy van egy kis tapasztalatom. Ez alapján mondom a következőket:

1. 32 Gb-os adatbázis az egyszerűen nevetséges. Az interneten levő oldalak száma nagyságrendileg 20-30 milliárd, tehát 32 Gb-ba minden oldalhoz kb. 1 byte fér bele. Mondanom sem kell, hogy ez kevés a kereséshez.

2. Még ha csak a magyar oldalakról lenne is szó, akkor is kevés a 32 Gb. Nem vagyok ebben igazán otthon, nem tudom kideríteni, hány .hu végű domain van bejegyezve és abból hány működik, de a bejegyzés előtti kéthetes várakozó listán most 4402 domain van. Ha feltételezem, hogy az utóbbi mondjuk 5 évben ugyanez volt a trend, és más nincs beregisztrálva vagy (már) nem működik, akkor is ez több, mint 572ezer magyar domain. Egy 32 Gb-os adatbázisba domain-enként 56 kb jut, ami persze semmi, hiszen egy oldalon átlagosan is jóval több szöveges információ van, arról nem is szólva, hogy ezt nem lehet csak úgy ömlesztett szövegként tárolni, ha normális idő alatt akarunk eredményeket mutatni a felhasználónak.

3. A MySQL adatbáziskezelőt én nagyon szeretem, tényleg gyors, nagy táblákat tud kezelni, stb. Van 10 Gb-os adatbázisom is és szépen megy. De táblánként néhány millió rekord felett már nem igazán bírja a kiképzést. Volt nem MySQL-hez kötődő, nagyobb rekordszámot tartalmazó fejlesztésem is, egyedi fejlesztésű indexeléssel persze kezelhető nagyobb rekordszám is, de MySQL-el nem.

4. Voltam befektetők által támogatott cégben is projektvezető. Ismerem a befektetők hozzáállását a dolgokhoz. @syck szerint pár 10 milliót kellene befektetni, és igaza van: de nem forintban, hanem dollárban vagy euróban. És nincs olyan elborult agyú befektető, aki egy Google-konkurrens fejlesztésére ennyit adna (na jó, a Microsoftnál volt, ld. Bing :) ). Előfordulhatna persze, hogy egy kifejezetten magyar piacra szánt keresőt fejlesztésére adnának pénzt, arra viszont ennyi túl sok, nem térülne meg.

5. Ha tényleg indexelnék az internetet vagy akár csak a magyar oldalakat, ahhoz akkora sávszélesség kell, ami egyszerűen túl drága ahhoz, hogy megérje kifizetni. A szorcs.hu oldalán még csak egy banner sincs, ami bevételt generálna. Az egész úgy hangzik, mintha a befektetők pénzére utaztak volna, megkapták, csináltak érte valamit, mostantól nem lesz további fejlesztés, mehet csődbe az egész.

6. Nyilván mindenkinek első dolga saját magára rákeresni minden keresőben. A Google első találatként kiadja a honlapomat, a szorcs.hu-n ez egyáltalán nem jelenik meg a találati listában. És egyáltalán, a Google-ben az első 100 találat 95%-a tényleg rólam szól, a search-en összesen 28 találat van, amiből öszesen 6 oldal vonatkozik rám. Elég sz@r eredmény…

7. Ha idézőjelek között keresek rá valamire (aminek mellesleg a keresés eredménye szempontjából nem sok jelentősége van, míg ugyanez a Google-nél igen hasznos tud lenni), akkor a második, harmadik, stb. oldalra kattintva az idézőjelek elé egy visszaperjel (\) karaktert rak. Ez a PHP-nek egy egész jól használható szokása (magic_quotes), miszerint a különleges karakterek elé berakja a \ karaktert, hogy adatbázis keresésekben, szövegekben ne kelljen ezt programmal megcsinálni. Ez OK is, csak elfelejtették leszedni a \ karaktereket a linkekből, egy triviális hiba. Komoly cég ilyesmit nem követ el…

8. A szorcs.hu a lighttpd WWW szervert használja. Ez nem rossz választás, gyorsabb, mint az apache, de ezzel nagyjából ki is merült minden előnye. Egy komoly szolgáltatás mögé nem felel meg, hogy csak néhány fontosabbat említsek: nincs benne cluster-ezési lehetőség, IP6 támogatás, komoly szoftveres támogatása sincs, és 1% alatti részesedése van az Interneten, miközben az Apache-nak 56%-a van.

Hát ennyi. Én úgy látom, hogy ez egy jól felfújt ballon, ami a szűrések miatt kezd leereszteni, de lehet, hogy mielőtt teljesen leeresztene ki fog pukkadni…