Өзін-өзі ұйымдастыратын тізім - Self-organizing list

A өзін-өзі ұйымдастыратын тізім Бұл тізім оның элементтерін кейбіреулеріне сүйене отырып қайта реттейтін өзін-өзі ұйымдастыратын эвристикалық жақсарту орташа кіру уақыты. Өзін-өзі ұйымдастыратын тізімнің мақсаты - жиі қол жетімді элементтерді тізімнің басына қарай жылжыту арқылы сызықтық іздеудің тиімділігін арттыру. Өзін-өзі ұйымдастыратын тізім, ең жақсы жағдайда, элементтерге қол жеткізу үшін тұрақты уақытқа жетеді. Өзін-өзі ұйымдастыратын тізім жұмыс уақытында әртүрлі сұраныстардың таралуына бейімделу үшін қайта құру алгоритмін қолданады.

Тарих

Өзін-өзі ұйымдастыратын тізімдер ұғымы іс-әрекетті ұйымдастыру идеясынан бастау алады[1] дискілерде немесе таспаларда сақталған файлдардағы жазбалар. Өзін-өзі ұйымдастыратын файлдар мен тізімдер туралы жиі айтылатын пікірлердің бірі - Кнут.[2] Джон МакКэйб бірінші-алға қарай жылжу (MTF) стратегиясының күрделілігіне талдау жасады, мұнда элемент қол жеткізілгеннен кейін тізімнің алдыңғы жағына жылжытылады.[3] Ол кездейсоқ тапсырыс берілген тізімге оңтайлы ретке келу үшін қажет орташа уақытты талдады. Тізімнің оңтайлы ретке келтірілуі - бұл тізімге заттардың қажет болу ықтималдығы бойынша тапсырыс беріліп, ең көп қол жеткізілетін элемент. Оңтайлы тапсырыс алдын-ала білінбеуі мүмкін, сонымен қатар уақыт өте келе өзгеруі мүмкін.

МакКейб транспозиция стратегиясын ұсынды, оған қол жеткізілген элемент тізімдегі алдында тұрған затпен алмасады. Ол орташа жағдайда транспозиция шекті жазбалардың оңтайлы реттелуіне жақындағанда MTF сияқты кем дегенде жақсы жұмыс істейді деген болжам жасады. Бұл болжамды кейінірек Ривест дәлелдеді.[4] Маккэб сонымен қатар транспозициямен немесе MTF эвристикалық тәсілдерімен эвристиканы тек N-ші қол жетімділікке қолданған жағдайда да, жазбаларды оңтайлы ретке келтіруге болатындығын және жазбаларды көшірудің салыстырмалы құнын көрсететін N мәні таңдалуы мүмкін екенін атап өтті. оңтайлы тапсырыс беруге тезірек жақындаудың мәні. Әрі қарай жетілдірулер жасалды және зерттеушілер ұсынған алгоритмдер: Ривест, Тененбаум және Немес, Кнут, Бентли және Макгеч (мысалы, өздігінен ұйымдастырылатын дәйекті іздеу эвристикасы үшін ең нашар талдау).

Кіріспе

Өзін-өзі ұйымдастыратын тізімнің қарапайым орындалуы - бұл байланыстырылған тізім осылайша кездейсоқ түйіндерді енгізу және жадыны бөлу кезінде тиімді бола отырып, кездейсоқ түйіндерге тиімсіз қол жетімділіктен зардап шегеді. Өзін-өзі ұйымдастыратын тізім қол жетімділік жиілігі негізінде тізімдегі түйіндерді динамикалық қайта құру арқылы тиімсіздікті азайтады.

Байланыстырылған тізімнің өтуінің тиімсіздігі

Егер белгілі бір түйінді тізімнен іздеу керек болса, тізімдегі әрбір түйінді қажетті түйінге жеткенше дәйекті түрде салыстыру керек. Байланыстырылған тізімде n-ші элементті шығару O (n) әрекеті болып табылады. Мысалы, массивпен салыстырған кезде бұл өте тиімсізмың элемент O (1) әрекеті.

Өзін-өзі ұйымдастыратын тізімдердің тиімділігі

Өзін-өзі ұйымдастыратын тізім тізімнің басында жиі кездесетін түйіндерді қайта реттейді. Әдетте, белгілі бір сұрауда, бұрын бірнеше рет қол жеткізілген түйінге қол жеткізу мүмкіндігі, тарихи тұрғыдан жиі қол жетпеген түйінге қол жеткізу мүмкіндігіне қарағанда жоғары болады. Нәтижесінде, жалпы қол жетімді түйіндерді тізімнің басында ұстау қажет түйінге жету үшін орташа жағдайда қажет болатын салыстырулар санын азайтады. Бұл тиімділіктің жоғарылауына және сұрау уақытын қысқартуға әкеледі.

Өзін-өзі ұйымдастыратын тізімді енгізу

Өзін-өзі ұйымдастыратын тізімнің орындалуы мен әдістері стандартқа сәйкес келеді байланыстырылған тізім. Байланыстырылған тізім мен өзін-өзі ұйымдастыратын тізім тек түйіндерді ұйымдастыру тұрғысынан ерекшеленеді; интерфейс өзгеріссіз қалады.

Тізімнен іздеу / іздеудің жұмыс уақытын талдау

Орташа жағдай

Орташа жағдайда n өлшемді өзін-өзі ұйымдастыратын тізімнен іздеуге кететін уақытты көрсетуге болады

Мұндағы p (i) - тізімдегі ith элементіне қол жеткізу ықтималдығы, осылайша қол жетімділік ықтималдығы деп аталады, егер әрбір элементтің қол жеткізу ықтималдығы бірдей болса (яғни p (1) = p (2) = p (3) = ... = p (n) = 1 / n), содан кейін элементтердің ретке келтірілуі маңызды емес және орташа уақыт күрделілігі келесідей болады:

және T (n) бұл жағдайда тізімдегі элементтердің жеке қол жеткізу ықтималдығына тәуелді емес, бірақ біркелкі жазбаға қол жеткізу ықтималдығы бар тізімдерде іздеу жүргізілген жағдайда (яғни бір элементке қол жеткізу ықтималдығы берілген тізімдер) басқасынан өзгеше), тізімдегі элементтерді дұрыс орналастыру арқылы уақыттың орташа күрделілігін күрт төмендетуге болады.

Бұл жалпы уақыттың күрделілігін төмендету үшін кіші i-ді үлкен қол жетімділік ықтималдығымен жұптастыру арқылы жасалады. Мұны келесідей көрсетуге болады:

Берілген тізім: A (0,1), B (0,1), C (0,3), D (0,1), E (0,4)
Қайта құрусыз іздеудің орташа уақыты қажет:

Енді түйіндер қайта реттелген тізім енді болатындай етіп, қол жетімділік ықтималдығы жоғары түйіндер алдыңғы жаққа жақын орналасатындай етіп қайта құрылды делік:
E (0,4), C (0,3), D (0,1), A (0,1), B (0,1)
Мұнда іздеудің орташа уақыты:

Осылайша, ұйымдасқан тізімді іздеуге кететін орташа уақыт (бұл жағдайда) кездейсоқ реттелген тізімді іздеуге кететін уақыттан шамамен 40% кем болады. Бұл дербес тізімнің тұжырымдамасы, бұл деректерді іздеудің орташа жылдамдығы түйіндерді қатынау жиілігіне сәйкес қайта құру арқылы жоғарылайды.

Ең нашар жағдай

Ең нашар жағдайда орналасатын элемент тізімнің соңында болады, ол кәдімгі тізім немесе өздігінен ұйымдастырылған болуы керек, сондықтан оған жету үшін n салыстыру керек. Сондықтан, тізімдегі сызықтық іздеудің ең нашар уақыты - бұл пайдаланылған тізім түріне тәуелді емес O (n). Алдыңғы бөлімдегі іздеудің орташа уақытының өрнегі ықтималдық екенін ескеріңіз. Тізімнің басында жиі кездесетін элементтерді сақтау ең жаман жағдайдың ықтималдығын азайтады, бірақ оны толығымен жоймайды. Тіпті өзін-өзі ұйымдастыратын тізімде де қол жетімділіктің ең төменгі элементіне (тізімнің соңында орналасқан) қол жетімді болса, оны алу үшін бүкіл тізім толығымен өту керек. Бұл жағдайды іздеу.

Ең жақсы жағдай

Ең жақсы жағдайда ізделетін түйінге жалпы қол жетімді және сол арқылы тізім анықталып, басында сақталатын түйін болып табылады. Бұл тұрақты уақыт жұмысына әкеледі. Үлкен белгілерде, ең жақсы жағдайда, элементке қол жеткізу O (1) әрекеті болып табылады.

Түйіндерді қайта құру әдістері

Тізімдегі элементтерге тапсырыс беру кезінде элементтердің қол жетімділік ықтималдығы алдын-ала белгілі емес. Бұл әр түрлі эвристиканың дамуына оңтайлы мінез-құлықты әкелді. Тізімдегі элементтердің ретін өзгерту үшін қолданылатын негізгі эвристика:

Алдыңғы әдіске көшу (MTF)

Бұл әдіс тізімге кіретін элементті жылжытады. Бұл оңай жүзеге асырылатын және қосымша жадты қажет етпейтін артықшылығы бар. Бұл эвристикалық, сонымен қатар, сұраныстың таралуындағы жылдам өзгерістерге тез бейімделеді. Екінші жағынан, бұл әдіс сирек кездесетін түйіндерге басымдық беруі мүмкін - мысалы, сирек кездесетін түйінге бір рет қол жеткізілсе, ол тізімнің басына жылжытылады және егер оған жиі қол жетімді болмайтын болса да, максималды басымдық беріледі. келешек. Бұл «артық» түйіндер тізімнің оңтайлы реттілігін бұзады және жалпы қол жетімді элементтердің кіру уақытын баяулатуға әкеледі. Тағы бір кемшілігі - бұл әдіс тым икемді болып, тез өзгеретін қол жетімділікке әкелуі мүмкін. Бұл дегеніміз, қол жетімділіктің қысқа естеліктеріне байланысты тізімнің оңтайлы орналасуы тізімдегі сирек кездесетін түйінге кіру арқылы бірден бұзылуы мүмкін.

Алдыңғы алгоритмге өту
Егер 5-ші түйін таңдалса, ол алдыңғы жаққа жылжытылады
T-ші элементті таңдау кезінде: егер i элементі таңдалды: i элементін тізімге көшіру

Санақ әдісі

Бұл техникада әр түйінді іздеу саны есептеледі, яғни әрбір түйін жеке есептегіш айнымалы ұстайды, ол әр шақырған сайын көбейтіледі. Содан кейін түйіндер азайып бара жатқан санға сәйкес қайта құрылады. Осылайша, ең жоғары түйіндер, яғни жиі қол жететіндер тізімнің басында сақталады. Бұл техниканың басты артықшылығы, ол, әдетте, қол жетімділіктің нақты үлгісін ұсынуда шындыққа сай келеді. Сонымен қатар, тізімдегі әрбір түйін үшін есептегіш айнымалы ұстау үшін қосымша жад талабы бар. Сондай-ақ, бұл техника қол жетімділіктің жылдам өзгеруіне тез бейімделмейді. Мысалы: егер бас элементтің саны A деп 100-ді айтса және одан кейінгі кез-келген түйін үшін B 40 деп айтса, онда B ең көп кездесетін жаңа элементке айналса да, оған кем дегенде (100 - 40 = 60) қол жеткізу керек ) ол бас элементке айналғанға дейін бірнеше рет, осылайша тізімді оңтайлы етеді.


Санау алгоритмі

Егер тізімдегі 5-ші түйінді екі рет іздесе, оны 4-шіге ауыстырады

ішінде: әрбір iAt t-ші элементті таңдау үшін (i) = 0 саны: егер i элементі ізделеді: count (i) = count (i) + 1 санау негізінде элементтерді қайта орналастыру

Транспоз әдісі

Бұл әдістеме қол жеткізілген түйінді алдыңғы жүйемен ауыстыруды көздейді. Сондықтан, кез-келген түйінге қол жеткізілсе, ол бас түйін болмаса, алдыңғы түйінмен ауыстырылады, осылайша оның басымдығы артады. Бұл алгоритм қайтадан оңай және кеңістікті үнемдейді және тізімнің алдыңғы жағында жиі қол жетімді түйіндерді сақтап қалуы ықтимал. Алайда, транспозия әдісі аса сақ. яғни элементті тізімнің басына жылжыту үшін көптеген рұқсат қажет болады. Бұл әдіс сонымен қатар тізімдегі түйіндер бойынша сұраныстың таралуы өзгеруіне жедел жауап беруге мүмкіндік бермейді.

Алгоритмді ауыстыру

Егер тізімдегі 5-ші түйін таңдалса, оны 4-шіге ауыстырады

T-ші элементті таңдау кезінде: егер i элементі таңдалды: егер мен тізімнің басшысы емеспін: i тармағын (i - 1) тармағымен ауыстыру

Басқа әдістер

Зерттеулер жоғары тиімділікке қол жеткізу үшін жоғарыдағы алгоритмдерді біріктіруге бағытталған.[5] Битнер алгоритмі бастапқыда MTF-ді қолданады, содан кейін трансформирование әдісін қолданады. Кейбір алгоритмдер рандомизацияланған және MTF алгоритмінде болуы мүмкін сирек кездесетін түйіндердің артық сыйақысын болдырмауға тырысады. Басқа техникалар жоғарыда көрсетілген алгоритмдердің негізінде түйіндерді тізімге әр n кіруден кейін немесе белгілі бір түйінге қатарынан n кіруден кейін қайта құруды қамтиды. Кейбір алгоритмдер бас түйініне жақындығы негізінде қол жеткізілетін түйіндерді қайта құрады, мысалы: Ата-анасымен ауыстыру немесе ата-анаға ауыстыру алгоритмдері. Алгоритмдердің басқа сыныбы іздеу үлгісі анықтамалықтың мекен-жайы деп аталатын қасиетті көрсеткен кезде қолданылады, оның көмегімен уақыттың белгілі бір уақыт аралығында тізімнің кіші жиыны ғана ықтимал болып табылады. Мұны белгілі бір элементтің қол жетімділік ықтималдығы оның көршілес элементтерінің қол жеткізу ықтималдығына тәуелді болатын тәуелді қол жетімділік деп те атайды. Мұндай модельдер деректер базасы немесе файлдық жүйелер, жадыны басқару және кэштеу сияқты нақты қолданбаларда кең таралған. Осындай тәуелді орталармен жұмыс жасайтын алгоритмдердің жалпы негізі тізімді тек қол жеткізілген жазбалар негізінде ғана емес, сонымен қатар оның жанындағы жазбалар негізінде қайта құру болып табылады. Бұл жазба тиесілі тізімнің ішкі тізімін қайта құруды тиімді қамтиды.

Өзін-өзі ұйымдастыратын тізімдердің қосымшалары

Компиляторлар мен аудармашылар сияқты тілдік аудармашылар өздігінен ұйымдастырылатын тізімдерді қолданады символдық кестелер бағдарламаның бастапқы кодын құрастыру немесе түсіндіру кезінде. Қазіргі уақытта мәліметтер құрылымын өздігінен ұйымдастыруға енгізу бойынша зерттеулер жүргізілуде ендірілген жүйелер осы тізбектердегі қуаттың бөлінуіне әкелетін шинаның ауысу белсенділігін төмендету. Бұл тізімдер де қолданылады жасанды интеллект және нейрондық желілер сонымен қатар өзін-өзі реттейтін бағдарламалар. Өздігінен ұйымдастырылатын тізімдерде қолданылатын алгоритмдер ретінде қолданылады кэштеу алгоритмдері LFU алгоритміндегі сияқты.

Қарапайым жылжу және транспозициялау әдістері шынайы коллекцияларда да қолданылады: мысалы, қолданылған заттарды жәшіктің алдыңғы жағына ауыстыру немесе тазалағыш затты қолданған кезде ең көршісімен ауыстыру.

Ескертулер

  1. ^ Беккер, Дж .; Хейз, Р.М. (1963), Ақпаратты сақтау және алу: құралдар, элементтер, теориялар, Нью-Йорк: Вили
  2. ^ Кнут, Дональд (1998), Сұрыптау және іздеу, Компьютерлік бағдарламалау өнері, 3-том (Екінші басылым), Аддисон-Уэсли, б. 402, ISBN  978-0-201-89685-5
  3. ^ Маккэб, Джон (1965), «Орналастырылатын жазбалары бар сериялық файлдарда», Операцияларды зерттеу, 13 (4): 609–618, дои:10.1287 / opre.13.4.609
  4. ^ Ривест, Рональд (1976), «Өздігінен ұйымдастырылатын дәйекті іздеу эвристикасы туралы», ACM байланысы, 19 (2): 63–67, дои:10.1145/359997.360000
  5. ^ Амер, Абделрахман; Oommen, B. John (2006). «Тізімдер бойынша тізімдер: анықтамалық мекен-жайы бар ортадағы тізімдерді өзін-өзі ұйымдастырудың негізі». Тәжірибелік алгоритмдер. Информатика пәнінен дәрістер. 4007. 109-120 бб. дои:10.1007/11764298_10. ISBN  978-3-540-34597-8.

Пайдаланылған әдебиеттер

  • Өзін-өзі ұйымдастыру (PDF), 2004
  • NIST DADS жазбасы
  • Drozdek, Java-дағы мәліметтер құрылымы және алгоритмдер
  • Амер, Абдельрехман; Джон Ооммен (2006), Тізімдер бойынша тізімдер: анықтамалық мекен-жайы бар ортадағы тізімдерді өзін-өзі ұйымдастырудың негізі, Информатикадағы дәрістер, 4007, дои:10.1007/11764298, ISBN  978-3-540-34597-8