Бастапқы кластерлеу - Primary clustering

Жылы компьютерлік бағдарламалау, бастапқы кластерлеу екі негізгі ақаулық режимдерінің бірі болып табылады ашық мекен-жай негізделген хэш кестелер, әсіресе пайдаланатындар сызықтық зондтау.Ол кейін пайда болады хэш соқтығысуы хэш кестесіндегі жазбалардың екеуінің бірдей күйге түсуіне себеп болады және жазбалардың бірін зондтар кезегінде келесі орынға ауыстыруға себеп болады. Бұл орын алғаннан кейін, осы жазбалар жұбы құрған кластер, жаңа жазбалардың алғашқы екеуімен бірдей орынға хэштелуіне қарамастан, одан да көп соқтығысатын жазбаларды қосу арқылы өсуі ықтимал. кластер ұзағырақ болады.[1]

Мысалы, in сызықтық зондтау, соқтығысқан жазба әрқашан хэш функциясы берген орыннан кейін келесі қол жетімді хэш-кесте ұяшығына жылжытылады және бос тұрған хэш-кесте ұяшықтарының сабақтас кластерін жасайды. Кластердің кез келген жеріне басқа жазба түскен сайын, ол бір ұяшыққа ұлғаяды. Осы құбылысқа байланысты тұрақтысы бар сызықтық зондтау хэш-кестесі болуы ықтимал жүктеме коэффициенті (яғни кестенің өлшемі, ол сақтайтын заттар санына пропорционалды) логарифмдік ұзындықтың бірнеше кластері болады және сол кластердегі кілттерді іздеуге логарифмдік уақыт кетеді.[2]

Байланысты құбылыс, қайталама кластерлеу, көбінесе сызықтық зондтауды және қоса ашық адрестік режимдерде болады квадраттық зондтау онда зондтар тізбегі кілтке тәуелсіз, сондай-ақ хэш тізбегінде. Бұл құбылыста сапасыз хэш функциясы көптеген кілттерді бір жерге хэштеуді тудыруы мүмкін, содан кейін олардың барлығы бірдей зондтар дәйектілігін сақтайды немесе бір-бірімен бірдей хэш тізбегінде орналасады, бұл олардың кіру уақыты баяулауына әкеледі.[1]

Кластерлеудің екі түрін де неғұрлым сапалы хэш функциясын қолдану арқылы немесе мысалы, хэштеу әдісін қолдану арқылы азайтуға болады екі рет хэштеу бұл кластерге аз сезімтал.[1]

Әдебиеттер тізімі

  1. ^ а б c Смит, Питер (2004), Қолданбалы деректер құрылымы C ++, Джонс және Бартлетт Learning, 186–188 б., ISBN  9780763725624.
  2. ^ Питтел, Б. (1987), «Сызықтық зондтау: іздеудің ықтимал уақыты жазбалар санымен логарифмдік өседі», Алгоритмдер журналы, 8 (2): 236–249, дои:10.1016 / 0196-6774 (87) 90040-X, МЫРЗА  0890874.