Archive for the ‘idea’ Category

Internet bez komputera?

21 August 2008

  • nie mogłem nie podsłuchać: “…pod telewizorem od Internetu…”
  • czy “…od komputera, czyli monitorem“?
    czy Inet z kablówki obsługiwany pilotem TV?
  • telefon?

    • zamiast 10 lat temu dodać do PDA obsługę GSM, marketing od 10 lat sprzedaje komórki dokładając po 1 funkcjonalności z PDA !*$&@&*! – “Automatic NOT for the people!”
  • Von Neumann architecture
  • TV? Media Center?
  • zegarek synchronizujący się z time server‘em
  • ramka (na kominku?) wyświetlająca zdjęcia z Flickr’a

Wi-Fi + Flash (for drivers) USB Dongle

7 August 2008

trying to get Wi-Fi connected on new system there’s always the chicken and egg problem: download drivers to get connected <-> connect to download drivers…

so why not get a Wi-Fi USB dongle with a flash card (or a pendrive with a Wi-Fi card) – this way you can always (dependent only on popular USB) connect first installing drivers needed, divered along with the device – drivers not on a CD, but on the device itself!

and since it’s a flash – you can update/add new drivers for any platform

a rys historyczny “jak na to wpadłem?” – w formie podcastu (nagrany na iPAQ, edytowany w Audacity):

od praktyki do teorii

15 July 2008

udało mi się rozwiązać (chyba dobrze) zadanie:

“Rzucamy n razy uczciwą monetą. Generujemy w ten sposób ciąg zmiennych losowych X_1, … X_n o wartościach ze zbioru {0,1}. Niech S_n będzie sumą wyników. Pokaż, że dla każdej ustalonej liczby naturalnej k prawdopodobieństwo Pr[ "S_n jest podzielne przez k"] dąży do 1/k przy n dążącym do nieskończoności.”

może nie specjalnie trudne (choć dla mnie to i tak za trudne), ale za to chciałem się pochwalić metodologią, jaką się posłużyłem… bo kartka i długopis by mi nie wystarczyły ;(

najpierw przetłumaczyłem sobie to zadanie na mój: “suma binarnych ciągów to po prostu losowa liczba z przedziału <0,n> – pomijam, że rozkład prawdopodobieństwa jej wylosowania nie jest równomierny, tylko Gaussowski (μ = n/2)”

następnie zweryfikowałem empirycznie, czy rzeczywiście liczba dzielnych dla których n%k == 0 dąży do hiperboli: nie udało mi się narysować wykresu, ale za to dało się suwakiem przesuwać wartości funkcji 1/k (niebieska) i w/w (czerwona) po wykresie

widać, że czerwona zdąża do hiperboli coraz mniejszymi schodkami od dołu – schodek jest, czyli mają równe wartości dla tych k, dla których n%k=0) => widać, że prawdopodobieństwo jest 1/k gdy n jest podzielne przez k, w pozostałych przypadkach jest mniejsze o… no właśnie o co mniejsze?

do tego doszedłem empirycznie badając różnicę między funkcjami – okazało się, że to prawdopodobieństwo jest mniejsze od 1/k o n%k/nk

mając prawdopodobieństwo, rozpisałem formalnie wzory na granice (patrz screenshot) i chyba jest OK ;)

ale ciągle nie wiem, czemu takie to prawdopodobieństwo ma być :)

załącznik (czemu można do WordPress wrzucać .odt, a nie można .ods?):

One to url them all…

25 June 2008

WordPress announced sitemaps support, which I though might be a chance for me to get all the post – not just last 10… so wouldn’t have to do cyclic rss parsing…

but no (here’s  mine), it’s just the permalink’s list… no author, tag/category, summary info that goes along with atom…

So then I thought the pretty permalinks + atom is the answer, i.e.: these are my first ten posts here:

http://marekopel.wordpress.com/2006/11/page/2

and atom for another 10 posts (last 10 from November):

http://marekopel.wordpress.com/2006/11/feed/atom

so the answer to my problem (i.e. atom for first 10 posts) would be:

http://marekopel.wordpress.com/2006/11/page/2/feed/atom

…but it won’t work… why? ;(

still I can go through each day of the calendar, i.e.:

http://marekopel.wordpress.com/2006/11/5/feed/atom

- hopefully you won’t get more than 10 posts a day…

but now I can see I can’t compete with GGL and index all the wordpress.com

once I was moaning about getting only a few thousands of crawled blogs using Next link, when there are hundreds of thousands of WP blogs created each month

now I think I gained the critical mass, and parsing only blogrolls (also the non-XFN ones) I got:

  • 2006.06.15: 25 996 WP blog URLs
  • a few days later: 55 689 WP blog URLs

and I only managed to parse half of it…

I can have 1000 WP blog’s atoms parsed in ~6 days… even when going parallel  (say 5 sessions – my server can handle that :) -> when I finish parsing the last thousand the first one is already outdated …

I hoped to experiment comparing my search engine (based on Solr – more details soon) to GGL Blog Search in a given period of time (say a week)… now even that seems impossible… what to do? what to do? <panic>

Impact Factor

15 May 2008

eBIP: “15 maja br. o godz. 12.15 w sali 241 bud. A-1 Politechniki Wrocławskiej odbędzie się seminarium Ach, Lista Filadelfijska! Ach, Impact Factor! czyli co Minister Nauki wiedzieć powinien. Seminarium poprowadzi dr hab. inż. Mirosław Soroka. Zapraszają JM Rektor Politechniki Wrocławskiej oraz Komisja Rektorska ds. Etyki.”

  • IF jest dla journal’a, a nie autora – świadczy o “jakości” pisma, a nie naukowca
  • IF daje złudne wrażenie, że nauka jest mierzalna
  • IF powoduje grafomaństwo naukowe
  • patenty – kolejny problem -> PL próbuje dogonić ilościowo USA :)
  • naukowcy mający po 2000 publikacji z pewnością naruszyli zasady etyki zawodowej
  • czasopisma abstraktowe bez cytowań
  • Gardield wymyślił SCI
  • SCI – nowa dyscyplina naukowa – mnóstwo publikacji n/t, ale tylko 6! krytycznych
  • niestety IF jest używany przez ustawodawców (podział środków)
  • naukowcy zamiast zajmować się nauką zajmują się zdobywaniem IF i mnożeniem publikacji
  • naukowcy cytują samych siebie, a nie autorytety w dziedzinie, bo to konkurencja!
  • ile % publikacji ma w tytule “new”, “novel”, “essential”? a ile razy jest to prawda?
  • największy grzech naukowca: marnotrawienie czasu, swojego i swoich uczniów
  • nauki nie można kupić, można ją sponsorować (licząc się z marnotrawieniem środków)
  • kwestia etyki jednostek niewiele zmieni, bo “jeśli wejdziesz między wrony…”
  • doktorant na 14 konferencjach -> “turystyka konferencyjna”

Zasada nieoznaczoności nauki:

  1. jeśli prowadzisz badania naukowe to nie wiesz ile środków Ci potrzeba
  2. jeśli masz określone środki, to nie wiesz ile badań naukowych za to zrobisz
  3. jeśli wiesz jedno i drugie, to nie jest to nauka :)

czy jeśli cytujemy krytykowaną pracę, żeby wskazać w niej błąd, to to cytowanie liczy się autorowi na plus?

Pierwszy VideoPost (n/t “blogów recenzowanych”)

11 May 2008

“Mój pierwszy video(pod)cast czy videopost. Refleksja n/t cytowania blogów w publikacjach naukowych. Pomysł na zastąpienie czasopism recenzowanych blogami komentowanymi. Kwestia autorytatywności recenzentów (komentujących) np. za pomocą Technorati Authority (& Rank).” – [GVideo]

jak to jest, że – odkąd (przez MPEG4, tanie webcam’y, komórki i aparaty) video przestało być problemem – znów pojawiły się problemy z audio? :(

“matchmaker matchmaker make me a match”

5 May 2008

“[...] so the blue balloons are men and the pink balloons are women… and the darker balloons are older people and the lighter balloons are younger people [...]“

and it’s… online dating clustering?

p.s. “[...] intelligence is the no1 turn on for people over all [...]” :)

Clusty

27 April 2008

…and another competitor:

Clusty the clustering search engine

Possibly related posts

27 April 2008

Possibly an Announcement « WordPress.com

I thought I’d make a blog search engine and apply my Ph.D. research posts clustering algorithms to it, but it seems WordPress is already doing the job for me – first Tag Surfer, now this… should I be glad? :|

P2P backup

15 April 2008

while listening to IT Conversations | Jon Udell’s Interviews With Innovators | Phil Libin on EverNote I got this idea inspired by latest P2P services like money lending…

I try to replicate my most valuable data into several locations, but there’s always the threat that several is not enough. Lately, online servers are most common storage for my personal data. And, though I believe in e.g. Google’s backup policy, I felt like I should do more about it. So… how about replicating backups via P2P?

Just like in file swapping (backup can be 1, archive file) duplicate you precious data in as many locations as possible. The only difference is that it’s more like push (upload) than pull (download) in traditional swapping.

- So who’d like to host my data and what’s his business in it?
- Well, JWL sang: “I scratch your back, you scratch mine”.

- And what about privacy?
- Isn’t PKI enough? And “there’s alway a bigger fish”… than Blowfish :)

Also some specs I can think of now:

  • a backup may be fragmented (if too large) – also, since we need instant backup and rarely a recovery , fragmenting may be an optimal solution – and so it is in e.g. BitTorrent
  • if snapshot replication is not enough, incremental approach may also be supported
  • a priority of a backup may be set by it’s owner and respected by the network (community) for distributing and storage lasting
  • there may be a TTL for each archive fragment
  • the number of distributed locations you may use is proportional to the array size you offer for hosting (may be a part of a disk partition :)

that’s the idea – maybe I’ll get back to it later…

Aaaaahhh… should’ve known I was scooped > zoogmo.com … I still haven’t got that “GGL first” reflex yet :P