WebBiz

Blogul echipei WebBiz pentru proiectul Interfete Evoluate

Estimare rata clickuri pentru reclamele online

Deoarece plata se face la numarul de accesari a unei reclame ideea este ca cele mai bune sa fie afisate primele astfel incat profitul motorului de cautare sa fie maximizat.

Pentru reclamele cu un numar mare de afisari exista deja o statistica deci ne intereseaza un mod de calcul pentru reclamele noi.

Calculul ratei de clickuri se face pornind de la o rata medie de clickuri si urmarind apoi imbunatatirea diferentei intre aceasta si rata reclamei respective numita divergenta KL, printr-un algoritm regresiv.

Se iau in calcul pe rand diversi factori si se observa imbunatatirile. Acesti factori sunt: reclame ale aceluiasi client, reclame care folosesc aceeasi termeni de cautare, calitatea reclamei(aspect, factorul de atragere a atentiei, reputatia clientului, relevanta, frecventa de cautare a termenilor).

Sistemul de fisiere Google

Sistemul de fisiere Google este un sistem de fisiere distribuit, in care datele sunt stocate astfel incat sa se asigure anumite conditii obligatorii: datele sa poate fi accesate repede(fara a exista limitari-”bootle necks”), ele sa fie bine pastrate(cu ajutorul sistemelor redundante), sistemele sa isi revina repede in urma erorilor(de fapt fiind vorba de un sistem de fisiere atat de mare si atat
de des accesat erorile si caderile de sistem sunt mai curand regula decat exceptiile), scalabilitate , disponibilitate, latime mare de banda.

Arhitectura sistemului de fisiere Google se bazeaza pe clustere, un cluster fiind format dintr-un server master si mai multe chunck-servere(servere pentru bucati); serverul master avand rolul de a coordona celelalte servere, fluxul de informatie netrecand prin el pentru a nu gatui reteaua.

Serverul master pastreaza doar 3 categorii de date (metadata):spatiile de nume ale fisierelor si bucatilor, maparea fisier-bucati si chunckserverele cu replici (redundante); de asemenea retine si versiunea de upadate a replicilor astfel ca in cazul schimbarilor de informatie datele sa ramana consistente si hotaraste care dintre chunckserverele cu replici este primar, adica asupra caruia se efectueaza o mutatie prima data; el functioneaza pe un sistem de mutexuri astfel incat sa nu
apara erori.

Modificarile asupra serverelor secundare se fac secvential(si nu sub forma de arbore de exemplu), pentru a folosi eficient banda si a nu gatui sistemul folosind numai serverul master.


Cachingul si motoarele de cautare

In proiectarea eficienta a sistemelor de caching trebuie sa se aleaga un compromis intre diverse optiuni: caching static sau dinamic, caching cu raspunsurile exacte la o anumita interogare sau a listelor asociate unor anumiti termeni care se ragasesc in cautari.

Cachingul listelor de raspunsuri are o rata de cache hit mai mare si prezinta si un grad mai mare de libertate (deoarece din termeni se pot forma interogari noi), dar are si dezavantajul faptului ca volumul de informatii e mult mai mare si ca urmare trebuie sa se aleaga numai un set restrans de raspunsuri care sa fie pastrat; acesta se alege pe baza algoritmului rucsacului pastrandu-se raspunsurile la termenii cu o frecventa mare in interogari dar si cu un numar mic de raspunsuri in acelasi timp; in cazul alocarii dinamice se evacueaza din cache raspunsurile care au acest
raport mic.

In urma observatiilor s-a hotarat ca cel mai bun algoritm se bazeaza pe alocare statica foslosind un compromis, astfel interogarile cele mai frecvente sunt retinute intr-o parte a cache-ului, iar in cealalta parte se pastreaza liste de raspunsuri pe baza algoritmului descris mai sus si care se numeste QTF-DF.

Cristi

1 comentarii:

Anonim spunea...

Buna Ziua!
Eu sunt Vlad, unul dintre membrii Radio Whisper, un radio anti-manele dedicat bloggerilor si nu numai.
Am vizionat cu atentie blogul tau si vreau sa spun ca am fost foarte fascinat de ceea ce am gasit. Am fost atras de subiectele interesante si de originalitatea articolelor. Felicitari ! Încep sa îl citesc cu drag.
Noi promovam la radio diferite articole ale bloggerilor, iar azi am promovat un articol de-al tau ; am specificat sursa articolului si am deschis si un subiect pe baza acestuia. Daca doresti, poti sa ne recomanzi orice articol si noi îl vom promova.
Cu scuzele de rigoare pentru acest mesaj de tip spam,acest mesaj este dedicat tie si la cei care merita care ii citim aproape zi de zi.
Ne-ar face placere, de asemenea, sa stim ca ai dori sa ne sustii în acest proiect de radio si sa accepti o eventuala colaborare.
Pe Radio Whisper se difuzeaza toate genurile de muzica, exceptând manele si piesele necenzurate, avem si câteva emisiuni, stiri etc. Ne-am propus sa realizam un proiect mare, iar pentru asta avem nevoie de sustinerea si ajutorul tau si al celorlalti colegi bloggeri. Dorim sa cream o echipa numeroasa, de oameni cu un talent aparte si m-am gândit ca, poate, ai vrea sa ni te alaturi si sa colaboram, binenteles, pe unul dintre domeniile care îti place. Dorim, de asemenea,sa iti acordam un scurt interviu. Pentru noi sunt importante ideile si modul de a gândi al bloggerilor si al ascultatorilor nostri.
Îti multumesc pentru timpul acordat, iar acum îti propun sa adaugi linkul sau bannerul nostru pe blogul tau si sa ne dai add la id-ul asculta.whisper sau un email asculta.whisper@yahoo.com pentru a discuta mai multe.www.radiowhisper.com
Multumesc,Cu stima Vlad!