Използване на съдържанието на социалните медии за анализ на големи данни Корейски опит - Информационен портал

Модата, заимствана от Запада, стана странна: категорично и неуместно е да се декларира превъзходство. Където и да погледнете, виждате само най-добрите компании, разположени на парче земя: така червей хвали ябълка, без да забелязва съседните овощни дървета, без да знае за съществуването на други овощни градини.

Pokémon навлезе в общественото съзнание като феномен без сянка от реалност, запаси, сложна логистика, производствени отпадъци. И наскоро имах възможност да участвам в проект за обогатяване на клиентската база на представител на корейска търговска верига и обработката й с инструменти за анализ на големи данни.

Предложени са три нива на интеграция:

21% от предпазливите и не-алчни клиенти благоволиха да информират приложението за идентификатори на профили, задействане на онлайн статус и тагове за местоположение в режим „познат“ с 10% отстъпка.

Множество експерименти показват, че второто крило на "птица консумация" е общителността и възприемчивостта на клиента. Обитателите на мрежата, публикуващи повече от 10 недублирани публикации на ден, се оказаха лоши комуникатори - те размиват вниманието на последователите твърде много с различни публикации.

Тези, които публикуват от 5 до 10 публикации на ден, пишат изразителни текстове, привличат вниманието към себе си, лесно навлизат в джунглата на комуникацията, независимо от входната точка на информацията. Най-концентрирани се оказват клиентите, които публикуват по 15-30 публикации седмично – запазват фокуса, комуникират детайлно.

Групата със средна активност беше наречена „Ambivers“, те приеха средните показатели за активност, чувствителност ... и погрешно изчислиха: 67% от екстровертите (първата, най-общителната група), 41% от амбивертите и 23% от интровертите с разпределение на фотографски потвърдени покупки отговориха обективно на техните публикации:18, 7 и 8% при реално потребление: 26, 11 и 6%.

Екстровертите са по-склонни от другите да публикуват свои снимки, облечени с марката, в предните публикации, но не показват лоялност към търговците на дребно, които се опитват да угодят на отстъпките. Изглежда поведението им не е предизвикало верижни реакции, водещи последователи към магазините. Първоначалните хипотези не бяха потвърдени и не дадоха полезни модели.

Клъстерирането идентифицира четири стабилни групи жители на мрежата с предсказуеми модели на лично потребителско и мрежово поведение („Новаци“, „Адепти“, „Сдържани“, „Ентусиазирани“), но нито един от клъстерите не е имал значително влияние върху публикациите в собствената си група или в съседните. Проектът престана да бъде бавен.

Многобройни експерименти и хипотези с данните, посочени в профилите и числените параметри на интензивността на участие в дискусии, не дадоха резултати, така че беше решено да се откаже от анализа на личната информация, преминавайки към семантичен анализ на текстовете и компонентна оценка на снимки.

Снимките бяха качени в потока, нормализирани, завъртяни, подчертани и затъмнени, след което беше извършена независима оценка от трима експерти на последователни параметри:

Художествен вкус и оригиналност на композицията;

Общото впечатление за ентусиазъм и щастие върху лицата в кадъра;

Приветливост и степен на инвокативност на подписа под публикацията;

Наличието в снимката на елементи от логото на магазина, облеклото или марката;

Уместността на колекцията и съвместимостта на нещата в клуба на търговските марки на търговеца на дребно;

Споменаване на мястото на покупка, обективност на отзивите за облеклото, сравнителни степени в текста.

На втория етап анализирахме поведението на потребителите в точките на продажба, сравнявайки го с данни от мрежата. Wi-Fi в магазините, промоции на мобилни приложения за игри на трети страни (корпоративна отстъпка за обемни изтегляния) и RFID етикети помогнаха да се свържат артикули, донесени в пробните, но не закупени с мобилните телефонни номера на собствениците.

За всяка статия започна да се натрупва недостъпна преди това информация:

колко пъти представители на всеки клъстер са измервали и не са купували и по какви причини:

не седеше на фигурата;

не харесвам отпечатъка;

не отговаря на размера;

не стои добре с останалите дрехи;

колко подобни неща бяха донесени в пробната:

същия артикул, но различен цвят;

същата статия, но различен печат;

същия артикул, но различен размер;

колко свързани неща са внесени в пробната:

горна част за дъно или обратно;

други колекции или капсули.

Моделите започнаха да се появяват, когато бяха изградени веригите от клъстери: „Общителност“ (снимки и публикации) - „Профил“ (данни от въпросника) - „Опитване“ (успешност на обзавеждането в магазина) - „Успех“ (процент на придобивания след обзавеждане) - „Наблюдаемост“ (площ, етаж, тип изход).

Получихме две матрици от 1200 вероятности за всяка статия (3 „Общителност“ x 4 „Профила“ x 5 „Тестове“ x 5 „Късмети“ x 4 „Наблюдения“) - вероятността, че:

Именно този клиент ще закупи определен продукт в даден магазин.

Купувачът ще провокира верижна реакция на интерес и покупки сред онлайн приятели.

Имайки предвид разпределението на населението в магазините и успеха на продуктите сред клиентските клъстери, планирах да променя матрицата на асортимента, така че пристигащите клиенти да се сблъскат с повече посещения, но собственикът на международна верига за ежедневно облекло изпревари нетърпението ми:„Оставяте само попадения, а някои от тях неизбежно ще се превърнат в аутсайдери.“