Opublikowano: 29.XI.1969 58718 KI. 42 m3, 7/08 MKP G06f Twórca wynalazku: inz. Zbigniew Hoffman Wlasciciel patentu: Instytut Badan Jadrowych, Warszawa (Polska) Sposób wyboru i przyjmowania do pamieci informacji cyfrowych o najwiekszym prawdopodobienstwie Przedmiotem zgloszenia jest sposób wyboru i przyjmowania do pamieci informacji cyfrowych o najwiekszym prawdopodobienstwie pojawiania sie. Sposób stosowany jest przy rejestracji infor¬ macji cyfrowej obejmujacej bardzo duzy zbiór da¬ nych (np. 106 róznych danych cyfrowych) w którym informacja interesujaca posiada duzo wieksze praw¬ dopodobienstwa pojawiania sie niz tak zwane tlo, Zródlem informacji cyfrowej moze byc ekspery¬ ment fizyczny, w którym badane wielkosci jak energia czastki, masa czastki lub jej tor opisane sa przez zespól cyfr.Informacje cyfrowa moga takze dostarczac eks¬ perymenty biochemiczne, bio-fizyczne i inne zródla informacji o duzej liczbie danych statystycznych.Do rejestracji informacji stosuje sie cyfrowe urzadzenia jak analizatory wielokanalowe i wielo¬ wymiarowe oraz maszyny cyfrowe. Kazdy rodzaj informacji cyfrowej rejestrowany jest w odpowied¬ nim miejscu pamieci operacyjnej maszyny cyfrowej.Liczba mozliwych danych cyfrowych moze prze¬ wyzszac liczbe miejsc pamieciowych maszyn cy¬ frowych. Powstaja wtedy trudnosci (ostatnio coraz czesciej) z rejestracja informacji, spowodowana ograniczona wielkoscia pamieci operacyjnych ma¬ szyn cyfrowych.Znany jest sposób rejestracji informacji cyfrowej, stanowiacej bardzo duza liczbe danych, polegajacy na wyborze reprezentacyjnego zbioru danych cy¬ frowych (zwanego takze próbka informacji). Ten 10 15 20 25 30 sposób polega wiec na rejestracji wybranego zbio¬ ru danych cyfrowych zamiast gromadzenia wszy¬ stkich mozliwych danych. Redukuje sie dzieki te¬ mu liczbe mozliwych danych, dopasowujac rozmiar próbki informacji do wielkosci pamieci operacyjnej maszyny.Ustalenie reprezentacyjnego zbioru danych cy¬ frowych zawierajacego maksymalna ilosc intere¬ sujacej informacji, jest zagadnieniem podstawo¬ wym. Nie wszystkie dane cyfrowe przychodzace z eksperymentu lub zawarte w jakims zbiorze da¬ nych statystycznych sa interesujace. Duza liczba tych danych stanowi informacje uboczna i nie in¬ teresujaca, która nie potrzeba gromadzic.Znany sposób ustalania próbki informacji polega na kolejnym zapelnianiu miejsc pamieciowych ma¬ szyny zgodnie z czasem przychodzenia tych danych Tak zgromadzona próbka informacji zawiera w znacznej swej czesci dane cyfrowe nieinteresujace i wymaga przeprowadzenia szeregu klopotliwych procedur wzbogacajacych. Postepowanie majace na celu wzbogacenie próbki polega na przeprowadze¬ niu wstepnego pomiaru intensywnosci /lub cze¬ stosci pojawiania sie poszczególnych danych cyfro¬ wych.Tego rodzaju pomiar jest czasochlonny, gdyz wy¬ maga zgromadzenia dostatecznej liczby danych cy¬ frowych tego samego rodzaju, dla uwolnienia si° od bledów statystycznych. Miejsca pamieciowe w których zarejestrowano dane o malym prawdopo- 587183 dobienstwie pojawiania sie, (mala czestosc po¬ jawiania sie) kasuje sie i zapelnia sie ponownie.Przez kilkakrotne powtórzenie takiej operacji otrzy¬ muje sie próbke informacji obejmujaca najbardziej prawdopodobne /lub najczesciej pojawiajace dane cyfrowe.Opisana procedura wzbogacania ma szereg wad.Zgromadzenie próbki wymaga stasowania procedur wzbogacajacych, co jest zwiazane z kilkakrotna zmiana programu pracy urzadzen rejestrujacych.Automatyzacja tego 'procesu jesit trudna i wymaga- zawsze ingerencji czlowieka. Procedury wzbogaca-' jace przedluzaja proces ustalania reprezentacyjnej próbki i zwiekszaja koszty eksperymen/tów.Celem wynalazku jest ustalenie reprezentacyjne¬ go zbioru danych cyfrowych, obejmujacego infor¬ macje o najwiekszym prawdopodobienstwie poja¬ wiania sie. Zadaniem wynalazku jest stworzenie metody, która umozliwi szybsze wydajniejsze i efek¬ tywniejsze ustalenie próbki informacji, obejmujacej najbardziej prawdopodobne dane cyfrowe (dane powtarzajace sie najczesciej).Cel ten zostal osiagniety przez wprowadzenie wy¬ boru na zasadzie -porównania dwóch kolejnych in¬ formacji cyfrowych przy czym gdy róznica miedzy dwiema kolejnymi informacjami cyfrowymi nie przekracza ustalonej! uprzednio wielkosci liczbowej R, lub gdy najstarsze bity dwóch kolejnych infor¬ macji cyfrowych sa identyczne, co odpowiada wiel¬ kosci liczbowej R = 0, nastepuje przyjecie tej in¬ formacji do pamieci.Wartosc cyfrowa R, okreslajaca dozwolona róz¬ nice miedzy kolejnymi danymi cyfrowymi, wybie¬ rana jest w zaleznosci od dwóch czynników a im mniejsza jest ta wartosc, wtedy wlasnosci selek¬ cyjne nowego sposobu ustalania reprezentacyjnej próbki sa lepsze. Jednak czas ustalania próbki in¬ formacji zwieksza sie w miare malenia wartosci R. Praktyczna wartosc R ustala sie na zasadzie kompromisu miedzy tymi dwoma czynnikami.Podany sposób postepowania opiera sie na za¬ lozeniu, ze prawdopodobienstwo pojawienia sie 2-ch kolejnych danych cyfrowych, malo rózniacych sie miedzy soba, jest wieksze dla zakresów liczbowych o duzej czestosci pojawiania sie, niz odpowiednie prawdopodobienstwo dla zakresów liczbowych o malej czestosci pojawien.Przez zastosowanie opisanego sposobu otrzymuje sie próbki informacji zawierajace duzy procent in¬ formacji najbardziej prawdopodobnej. Nie potrze¬ ba ^przeprowadzac klopotliwej i dlugotrwalej pro¬ cedury wzbogacajacej. Ilosc informacji uzytecznej, uzyskanej z danego eksperymentu zwieksza sie.Polepsza sie takze efektywnosc wykorzystania pa¬ mieci operacyjnej maszyny cyfrowej. 58718 4 Przykladem zastosowania nowego sposobu ustala¬ nia reprezentacyjnej próbki informacji cyfrowej, moze byc eksperyment fizyczny dostarczajac 16.000 róznych danych cyfrowych. 5 Nalezy ustalic reprezentacyjna próbke 1000 da¬ nych cyfrowych, tak aby przy jej uzyciu okreslic obszary w których dane cyfrowe pojawiaja sie naj¬ czesciej, to znaczy posiadaja najwieksze prawdo¬ podobienstwo. Do tego celu stosujemy analizator z 10 pamiecia operacyjna o tysiacu miejsc.Gromadzenia reprezentacyjnej próbki informacji rozpoczyna sie w nastepujacy sposób. Kolejne da¬ ne cyfrowe przychodzace z eksperymentu fizyczne¬ go sa porównywane w specjalnym urzadzeniu po- 15 równujacym. Z chwila znalezienia dwóch kolejnych danych cyfrowych rózniacych sie miedzy soba mniej niz ustalona uprzednio wielkosc liczbowa R, przesyla sie je do pamieci operacyjnej analizatora, gdzie zajmuja pierwsze i drugie miejsce pamie- 20 ciowe.Nastepna para danych cyfrowych których rózni¬ ca jest mniejsza od R jest lokowana w trzecim i czwartym miejscu pamieciowym.W ten sposób zapelnia sie tysiac miejsc pamie- 25 ciowych.Mozna rozpoczac gromadzenie próbki od porów¬ nania najstarszych bitów kolejnych danych cyfro¬ wych. Z chwila znalezienia dwóch kolejnych danych cyfrowych o identycznych najstarszych bitach, prze- J0 syla sie te dane do pamieci operacyjnej analizatora, gdzie zajmuja pierwsze i drugie miejsce pamiecio¬ we. Dalej postepuje sie podobnie jak w przykla¬ dzie poprzednim. Zebrana tymi sposobami repre¬ zentacyjna próbka informacji zawiera dane cyfrowe 35 o najwiekszym prawdopodobienstwie. Majac okre¬ slona próbke informacji mozna wyznaczyc intere¬ sujace w danym eksperymencie parametry fizycz- 40 PL