Le strane attività degli aggregatori di notizie – il caso di socialblog.it –

Sono tanti i feed aggregator e ne nascono sempre di nuovi in continuazione. Sono estremamente comodi in quanto selezionano il contenuto tra i vari blog che aderiscono all’iniziativa, per categoria e per qualità.

In teoria, una redazione che predispone una sorta di rassegna stampa della blogosfera per argomenti.

In pratica, a volte, succedono cose strane.

Succede infatti di trovare contenuti propri aggregati altrove senza alcun tipo di autorizzazione.

Guardando i link in entrata sul mio blog, ho notato quanto segue:

La mia bacheca WordPress
La mia bacheca WP

Noto sulla bar l’indirizzo: non ricordo di aver autorizzato o richiesto alcun tipo di aggregazione/affiliazione a quel circuito denominato socialblog.it.

Clicco. Evidentemente un link rimosso. Strano. Condivido le mie perplessità su dei SN.

Google è un amico:

Ricerco i miei contenuti indebitamente aggregati da socialblog.it

Eccoli i link, regolarmente indicizzati ma cliccando non vedi l’articolo. Nessuno dei due che sono rispettivamente qui e qui.

In pratica oltre al web scraping (e l’appropriazione di contenuti non autorizzata) anche un problema di reputation visto che i titoli indicizzati e l’incipit dei contributi sono evidentemente riferiti a mie pubblicazioni che gli utenti alla fine NON trovano.

Nulla di grave ma visto che su quel sito la pubblicità abbonda e sfrutta anche il richiamo dei miei contributi, la situazione scoccia. Da notare la licenza creative commons, del tutto ignorata, col quale sono pubblicati i miei post.

Provo a contattare tramite il modulo contatti. Risultato: pagina bianca. Non saprò mai se la mia segnalazione e richiesta chiarimenti è andata a buon fine o meno. Non un bel biglietto da visita per i miei gusti.

Whois:

Whois del dominio socialblog.it

Due nomi: uno verosimilmente polacco ed uno italiano.

Google. Uno legato ad altre registrazioni per conto della società trevigiana Domains Income (vedi footer di socialblog.it) e l’altro legato al marketing su social network.

Socialblog.it venduto

Contattato l’italiano su friendfeed (il thread al momento è pubblico) dice di aver venduto ma il whois del nic non sembra essere d’accordo (o semplicemente non si son presi la briga di aggiornarlo, capita).

Ad ogni modo, non ho motivo o interesse a non credergli.

Morale della favola, controllate sempre i link in ingresso e sui vostri post fate un link sempre ad un altro vostro post: sembrerete megalomani ma non a tutti.

Non resta che aspettare la rimozione da parte di google dei link non più presenti.

N.B: le informazioni di cui sopra sono, al momento, pubbliche ed interamente disponibili a chiunque.

****Aggiornamento 1****

Cache di google in data 22/01/2010

Fonte: BloggerItaliani.com via Merlinox in Google Reader“?

****Aggiornamento 2 ****

La società Domains Income S.rl., nella persona di Angelo Di Sotto, si è resa disponibile a chiarire il disguido tecnico alla base dell’erronea pubblicazione di due miei post non autorizzati. Qui trovate il commento e le giustificazioni addotte. Si ringrazia Angelo Di Sotto per la celere disponibilità.

****Aggiornamento 3 ****

Con qualche accortezza si riesce a tracciare quanto viene copiato dal tuo blog.
Appena verificato su allblogs.it (nota: allblogs.it è autorizzato ad usare i mie contributi *se li prende da me*, non da terzi)

Allblogs.it importa via socialblog.it che importa da bloggeritaliani.com che importa da me

Insomma, siamo arrivati ad aggregatore di aggregatore di aggregatore di contenuti.

37 thoughts on “Le strane attività degli aggregatori di notizie – il caso di socialblog.it –

  1. L’appropriazione di contenuti non autorizzata da parte di questi pseudo aggregatori è una cosa fastidiosissima. solidarietà (visti i miei precedenti, che citi) e aspetto l’evolversi della storia. Intanto ho commentato anche io su Friendfeed 🙂

  2. Ciao, eccomi qua!
    Dunque, come ho già detto, ho venduto il sito a Domains Income Srl (che figura nel whois).

    Puoi trovare qua l’asta, conclusasi a novembre scorso.

    Grazie per aver notato che non è stato aggiornato il mio nome, chiederò ai responsabili di sistemare e magari di leggersi questo articolo. Così da non essere più chiamato in causa per i loro casini ^^

    Quando SocialBlog.it era mio, accettavo le richieste di iscrizione che gli utenti facevano di loro spontanea volontà, non ho mai inserito nessun blog senza chiedere il permesso (e tanto non mi sarebbe servito, visto che avevo un sacco di richieste al giorno).

    Cosa facciano loro adesso, non saprei… Magari ti hanno inserito e poi rimosso… per questo ora i link alle tue pagine non esistono più.

    Comunque sia, mi spiace per il disagio.
    Ciao!

    1. Ciao Ghido, grazie della pronta risposta. E’ senza dubbio un intervento auspicato e chiarificatore. Son contento di esserti stato utile a scovare la mancata comunicazione al nic da parte dell’acquirente.
      Ne approfitto anche per segnalarti che anche tu hai dimenticato di rimuovere socialblog.it dai tuoi “Site Authored” nel profilo mybloglog: sembra che questo dominio faccia perdere la memoria.

      Ad ogni modo, grazie del tuo intervento.

      1. Hai ragione: mi sono ricordato di toglierlo dalla lista dei miei siti su BigThink, ma non da mybloglog.
        Ora sistemo, così non ci sarà più alcun collegamento con me 😉

  3. http://www.giorgiotave.it/forum/mondo-domini-aste-vendita-ed-acquisto/125819-asta-socialblog-aggregatore-di-blog-ben-avviato.html

    Qui trovi l’asta per la vendita di socialblog.

    Credo a Ghido anche perchè avevo letto l’annuncio (sono moderatore e forumista GT) e ‘conosco’ il network che ha comprato (a cui puoi risalire a partire dal footer di socialblog e con gugol.. ).

    Hanno decine di domini… centinaia.
    Credo si tratti di un provider, o qualcosa di simile. 🙂

  4. si Seo, ho notato anche io la pletora e la tipologia di domini detenuti dall’acquirente. Propendo più per “qualcosa di simile” 😉

    Inoltre, da quanto affermato da Ghido mi sembra di capire che non è un caso isolato.

  5. Un ultimo appunto: quando ero admin del sito e controllavo le richieste di aggregazione, spesso succedeva che venissero fatte richieste non dalll’admin!

    Ad esempio, una volta si è iscritto JuliusDesign, io l’ho inserito con piacere, ma poi ho scoperto che non si era iscritto lui! Qualcun altro l’aveva inserito senza il suo permesso…. Idem mi pare fosse successo con MaestroAlberto.

    Lo stesso può essere successo con Merlinox e con ArMyz. Domains Income Srl è un’azienda seria, comunque, non credo che aggiunga domini a casaccio come altri pessimi aggregatori.

    Comunque io non inserivo più nulla da un anno quasi… non avete idea della coda di blog che voleva essere aggregata.

    Morale della favola, basta chiedere loro di rimuovere il tuo sito dall’aggregatore. Penso che la mail sia ancora info [AT] socialblog.it

    Ciao!

    1. Si Ghido, ti ringrazio ancora una volta della disponibilità. La rimozione in sè non ha senso chiederla perchè difatti non sono più presente. Quello che a questo punto mi preme capire è per quale motivo è successo.
      Se guardi lo screenshot relativo all’aggiornamento 1 (copia pagina da google cache) vedrai che la fonte non sono nemmeno io direttamente ma “Blogger Italiani” – il google reader di Merlinox.
      Sono correttamente aggregato da Bloggeritaliani.com ma non capisco per quale motivo socialblog.it o chicchessia debba importare dei miei contenuti da un terzo senza la mia (preventiva) autorizzazione.

      1. Ah, è vero!! Ecco risolto il mistero allora!

        Evidentemente socialblog.it aggregava il feed di BloggerItaliani e quindi anche tu ti sei ritrovato dentro.

        E’ probabile che qualcuno abbia segnalato loro il feed e l’abbiano aggregato… per poi accorgersi dell’errore (ovvero che BloggerItaliani non è un blog, ma un aggregatore esso stesso).

        Quindi, una volta rimossa l’aggregazione, si sono cancellati anche tutti gli articoli, che tuttavia erano già stati indicizzati da Google.

        Mi sembra la spiegazione più plausibile, no?

  6. No, la fonte è il google reader di Merlinox. Chi ha importato il feed di Merlinox (socialblog) non si è curato di importare solo quanto autorizzato/richiesto. Sbaglio?

        1. E allora…. sarà successo quello che ti ho scritto sopra:
          1- hanno aggregato il feed di BloggerItaliani
          2- gli articoli sono stati inseriti (tra cui i tuoi)
          3- hanno rimosso il feed
          4- hanno cancellato gli articoli
          5- gli articoli sono rimasti su google

          1. Sicuramente è successo quanto dici. Mi ripeto: perché è successo, non come. Il come è chiaro, mi chiedo il perché. Io ho autorizzato bloggeritaliani ad aggregare i miei dati. Non ho autorizzato socialblog. Quando si importa contenuti multi utente si controlla o è una prassi ormai desueta?

          2. Eh si, è chiaro. Evidentemente Merlinox fa il suo aggregatore con google Reader ed evidentemente socialblog aveva importato tutto il feed.
            Una volta che Merlinox ha chiesto la rimozione anche i tuoi post sono scomparsi (…vi leggevo su FF).

  7. Beh, io ho un piccolo aggregatore ad iscrizione tassativamente volontaria.

    🙂

    Vuoi sapere quanti-quali domini/siti ‘ciucciano’?

    Meglio di no… ma voglio anche dire che al 90% dei casi si tratta di domini che muoiono nel giro di pochi mesi, se non settimane.

    Motivi:

    – esplosione dello script e/o del Db;
    – scarse performance su Google (elevatissima frequenza e zero trust= poche pagine effettivamente indicizzate e nessuna posizionata)

    Invece SocialBlog è (era?) un ottimo aggregatore… direi uno dei migliori italiani; di quelli non enormi, ovviamente.

    Per come la vedo io: per un buon blog (come questo e come molti altri) l’aggregazione in un sito come socialblog non può essere dannosa, anzi, può pure portare qualche vantaggio.

    Altro discorso può farsi se si tratta di un blog neonato e/o poco popolare/seguito… dove invece l’abuso di ‘aggregatori’ può portare molti svantaggi.

    ———————–

    Tutto questo non cambia di una virgola il discorso sulla leggittimità di aggregare o meno un feed senza consenso.

    Ma anche qui voglio quotare Ghido: capita molto spesso di trovarsi segnalazioni dall’origine ignota.

    Io per ovviare al problema mi sono imposto e impongo agli iscritti di esibire l’antipixel: se mi linki vuol dire che sei proprio tu e che vuoi essere aggregato, direi!

    🙂

    Se anche si segnala Beppe Grillo in persona non lo accetto se prima Casaleggio non gli edita il blogroll o il footer.

    😛

    1. Ti ringrazio, Seo Guru. In effetti ero contento di SocialBlog, ma non sono proprio riuscito a monetizzarlo, oltre al fatto che non riuscivo più a stare dietro a tutte le richieste.

      E’ un peccato che ora abbiano deciso di aprirlo a tutti i tipi di siti, mentre prima aggregava solo blog informatici (e questo era il motivo del suo successo, credo).

      Comunque sono da evitare come la peste gli aggregatori che inseriscono l’intero articolo nelle loro pagine. SocialBlog, invece, ne riporta solo la prima parte, quindi non è penalizzante.

      1. Beh, si, non è che gli aggregatori monetizzino molto, assolutamente direi di no. Il fatto di pubblicare l’estratto è praticamente un obbligo, secondo me. SocialBlog era particolare perchè usava quell’iframe laterale … verde, se non ricordo male.
        Beh, sicuramente era un metodo assolutamente non-spammoso di aggregare.

  8. @Armyz “Quando si importa contenuti multi utente si controlla o è una prassi ormai desueta?”

    Non si importa. Gli aggregatori degli aggregatori sono fuori logica. IMHO.

  9. Buonasera Armando Leotta,

    sono Angelo Di Sotto di Domains Income S.r.l.
    Vogliamo scusarci per il piccolo disguido con il suo blog e spiegarle quanto accaduto.

    A seguito del suo articolo ci terremmo a specificare che blog.armandoleotta.com non è mai stato presente nella lista dei siti web aggregati su socialblog.it.
    L’aggregazione dei suoi 2 articoli è capitata quindi per “aggregazione di aggregatori”: Socialblog aggregava bloggeritaliani.com, che a loro volta aggregano il suo blog. Come ben capirà non abbiamo il controllo sui feed di altri aggregatori; inoltre il feed di bloggeritaliani.com è stato aggiunto prima del nostro acquisto.

    Due giorni fa abbiamo ricevuto una mail da Merlinox che richiedeva la “rimozione immediata” del suo feed da socialblog.it, cosa che abbiamo fatto ieri eliminando tutti gli articoli ricevuti dal suo feed (per questo motivo si ha un errore 404 alla richiesta dalle pagine web).

    Oggi abbiamo ricevuto una mail da Daniele Ghidoli che, oltre a chiedere la sostituzione del proprio nome sul Whois, ci ha segnalato l’articolo.

    SocialBlog aggrega solo blog che ne hanno esplicitamente richiesto l’inserimento. Da quando abbiamo acquistato il blog da Daniele Ghidoli abbiamo inserito solo una decina di siti e attualmente ci sono oltre 100 blog in coda per l’inserimento.

    Chiediamo quindi cortesemente la rimozione dell’articolo o una rettifica dello stesso.

    Saluti

    1. Gentile Angelo Di Sotto,
      la ringrazio di avere accettato il mio invito a rendere pubblico sotto forma di commento quella che inizialmente era uno scambio di mail.
      Mi sembra di capire che le scuse per avere pubblicato dei contenuti senza espressa autorizzazione dell’autore e aver così violando anche le creative commons con cui i miei contenuti sono rilasciati siano tutte racchiuse nell’ermetico “vogliamo scusarci per il piccolo disguido”.

      A beneficio di tutti spero vivamente che questa pratica incontrollata, a detta sua, di “aggregazione di aggregatori” sia frutto di una involontaria problematica tecnica di passaggio di consegne tra vecchio e nuovo gestore.
      Altresì capisce bene che l’utente danneggiato (io in questo caso) non è tenuto a capire chi aggrega cosa *oltre* il primo passaggio: i miei contenuti erano altrove, senza autorizzazione e per scopi diversi da quelle ulteriormente previste dalla licenza CC.
      Inoltre non capisco il profondo significato ed utilità di “aggregare aggregatori”.
      Ad ogni modo, nella speranza di non ritrovare articoli non espressamente autorizzati, le auguro buona fortuna con il neo-aggregatore.
      Come d’accordo, per correttezza e trasparenza aggiorno il post sottolineando la sua apprezzata disponibilità a chiarire il “piccolo disguido” ed inserendo un collegamento al suo commento.

  10. Tempismo perfetto, anche nella risposta dei responsabili. Ottimo, allora esistono.

    Scusate se mi intrometto.

    La rimozione del post è impensabile. Forse l’aggiunta di questa precisazione dei responsabili, che comunque risulta dai commenti. Ma la rimozione perchè?

    Ad @armyz è successo questo. L’ha raccontato e con contenuti pubblicamente disponibili in rete a saperli cercare. Li ha cercati, li ha fotografati, li ha pubblicati, per sè, i suoi lettori e per il web che nulla dimentica.

    Sarà libero di raccontarlo, oggettivamente, come ha fatto, sul suo blog?
    Chi aggrega si sente libero di aggregare e pubblicare roba di altri, anche senza verificare se può o meno, mentre un blogger sul suo blog non può raccontare cosa gli succede?

    Siamo al paradosso.

    Cos’è? Ora il motore di ricerca porta qua su questa storia anzichè portare là? E tutti possono leggere e far tesoro di quello che è successo ai contenuti di @armyz?

    E magari riflettere? E magari chiedere di essere tolti dall’aggregatore? E magari rivelare cosa fa un aggregatore?

    Il torto è in chi aggrega, se c’è. Molto facile anche dimostrarlo, volendo, in presenza di licenze e altri piccoli accorgimenti che ogni blogger oramia usa.

    Aggregatori di aggregatori è una cosa meravigliosa. Come dire: scarica barile.
    Complimenti.

  11. Armando, gli aggregatori sollevano effettivamente una serie di importanti problematiche dal punto di vista giuridico (specialmente in materia di diritto d’autore sui contenuti) … poi ovviamente ci sono aggregatori che sono più consapevoli di queste criticità e trasparenti (sul meccanismo di funzionamento, ad esempio) ed altri che lo sono meno…
    Ovviamente concordo con @catepol per il resto … non comprendo il motivo della richiesta di rimozione del post … ti sei limitato alla narrazione dei fatti, senza nessun accento polemico (come pure sarebbe stato comprensibile) ed hai dato contezza di tutti gli sviluppi e chiarimenti 🙂

    1. Ernesto, ti ringrazio del tuo contributo. Per quanto eventualmente comprensibile, come giustamente dici tu, ho volutamente evitato l’innesco di polemiche perchè, alla fine, sono quasi sempre sterili.
      Vorrei solo che episodi come questi, a prescindere dall’aggregatore X piuttosto che Y non avvengano più perchè sviliscono il lavoro degli altri e ricoprono l’argomento e le categorie coinvolte di un alone di scarsa chiarezza e trasparenza.
      Ed è un vero peccato. Spero che questa disquisizione ed approfondimento possa servire da esempio per tante realtà ben peggiori.

  12. Si. Posso dire una cosa?
    Perchè quasi nessuno ha la pagina ‘Rimuovi feed’ ?

    Non ci vuole mica molto: se ti vuoi iscrivere ti iscrivi, se vuoi dis-iscriverti lo puoi fare egualmente.

    Ve le ricordate le polemiche storiche su BlogBabel?

    Non ci si poteva sottrarre, una volta inseriti.. forse catepol se le ricorda meglio e può raccontarcele ‘di prima mano’.

    —————————————————————–

    Però voglio anche aggiungere il fatto che – sul piano dei contenuti e dei diritti d’autore – la scorrettezza non è solo degli aggregatori tout court.

    Chiaramente sono in torto quelli che fanno scraping senza autorizzazione – ma non è il caso di SocialBlog… assolutamente.

    🙂

    Se volete che vi linko degli scrapers veri fatemi un fischio… si tratta di tutt’altro genere di siti.

    Anche i bloggers rubano contenuti… sapete?

    Molti dei blog che si sono iscritti al mio servizio, ad esempio, pubblicano e si promuovono su internet con l’idea di guadagnare con link in affiliazione e cose del genere.

    Ok.

    In alcuni casi – non pochi – non esitano a copiare interi articoli a portali famosi come Libero o Excite o a siti di quotidiani come Repubblica e il Corriere.

    Io quando e se me ne accorgo chiaramente li banno dal sistema…. mi sembra logico.

    Eppure sono sicuro che molti di loro replicano quegli articoli (… articoli… veline d’agenzia, molto spesso…) in ‘buona fede’ – con molte virgolette.

    Cioè sto parlando di giovani e meno giovani che hanno blog semi-amatoriali e che ripropongono – anche – notizie provenienti dal cosiddetto mainstream.

    Ora: chi offre un servizio di aggregazione (ma vale anche per il bookmaking, al 100 per cento) non può materialmente leggersi tutti gli articoli e verificarne l’autenticità.

    E non solo: anche i grandissimi aggregatori nazionali e non (da Liquida a Wikio.. fino ad altri come OkNotizie etc etc.) accettano – se non erro – segnalazioni spontanee.

    BlogCatalog ti fa mettere un meta tag nel codice, per evitare mis-understanding.

    Ma altri ‘grandi’ magari no.

    Insomma: non facciamo di tutta l’erba un fascio, voglio dire.

    E mi dispiace anche per Ghido che – ripeto – ha tirato su un ottimo sito, che aveva ed ha decine di richieste di inclusione…. quindi non credo proprio abbia mai avuto l’interesse di includere gente ‘a casaccio’, come sicuramente non sta facendo nemmeno la nuova gestione.

    Ripeto anche questo: sono ben altri gli scrapers… siti che per’altro non si trovano mica su Google, beninteso.

    In questo senso sarebbe bene avere più fiducia nell’algoritmo dei motori di ricerca.

    Il più grande aggregatore del mondo si chiama Google News.
    Il secondo probabilmente è lo stesso Friend feed dove alcune di queste discussioni sono cominciate.

    🙂

    Insomma, non è la diffusione dei feed il ‘problema’.. spero che su questo siamo tutti d’accordo.

    Anche tra i bloggers c’è una variegata percezione della cosa: ci sono quelli che si iscrivono a destra e a manca, spargendo il feed in ogni dove; e ci sono quelli che invece se ne guardano bene, al limite preoccupandosi oltre il necessario.

    Voglio dire: se uno ti vuole proprio rubare gli articoli se li stampa per intero e non linka l’originale.

    Quello è vero scraping (e furto, probabilmente).

    Per il resto c’è sempre Google: il singolo blogger defraudato può usare lo strumento giusto –> http://www.google.it/webmasters/spamreport.html

    C’è proprio la voce ‘Contenuti duplicati’.

    Anche qui, cerchiamo di apportare qualcosa di utile alla discussione sorta in quest’occasione.

    Esiste un tag rel adatto allo scopo, che consiglio a tutti i gestori di aggregatori e bookmark.

    Io a mia volta l’ho ‘copiato’ da Digg…. che sicuramente rimbalza migliaia di contenuti riproponendone stralci e in parte usurpandone il title… ma che altrettanto sicuramente non può essere sospetto di mala-gestione e/o di spam.

    🙂

    Basta aggiungere rel=”dc:source” al link verso la fonte: si comunica agli spider che la notizia riportata ha una fonte univoca (‘document source’).

    Gli attributi rel per i link fanno parte delle numerose novità che troveremo in html 5 – non appena il lungo percorso di elaborazione porterà all’approvazione definitiva del nuovo standard.

    Per il momento esistono già questi microformati e sono – secondo me – già presi in considerazione dai grandi motori di ricerca.

    ————————————

    E chiedo scusa ad Armyz per questo pippone… ma forse questa poteva essere l’occasione per dire anche questa cosa.

    Buon weekend !

    🙂

    1. Mi sento di condividere più o meno tutto quello che dici e ti ringrazio del contributo utilissimo.
      Attendiamo l’HTML 5 con fiducia ma anche con la consapevolezza che ci potranno ancora essere casi analoghi e ben peggiori (ad esmepio dove c’è malafede) di quello trattato qui.
      Buon weekend anche a te!

  13. Pingback: SicuraMente

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.