Използване на съдържанието на социалните медии за анализ на големи данни Корейски опит - Информационен портал
Модата, заимствана от Запада, стана странна: категорично и неуместно е да се декларира превъзходство. Където и да погледнете, виждате само най-добрите компании, разположени на парче земя: така червей хвали ябълка, без да забелязва съседните овощни дървета, без да знае за съществуването на други овощни градини.
Pokémon навлезе в общественото съзнание като феномен без сянка от реалност, запаси, сложна логистика, производствени отпадъци. И наскоро имах възможност да участвам в проект за обогатяване на клиентската база на представител на корейска търговска верига и обработката й с инструменти за анализ на големи данни.
Предложени са три нива на интеграция:
21% от предпазливите и не-алчни клиенти благоволиха да информират приложението за идентификатори на профили, задействане на онлайн статус и тагове за местоположение в режим „познат“ с 10% отстъпка.
Множество експерименти показват, че второто крило на "птица консумация" е общителността и възприемчивостта на клиента. Обитателите на мрежата, публикуващи повече от 10 недублирани публикации на ден, се оказаха лоши комуникатори - те размиват вниманието на последователите твърде много с различни публикации.
Тези, които публикуват от 5 до 10 публикации на ден, пишат изразителни текстове, привличат вниманието към себе си, лесно навлизат в джунглата на комуникацията, независимо от входната точка на информацията. Най-концентрирани се оказват клиентите, които публикуват по 15-30 публикации седмично – запазват фокуса, комуникират детайлно.
Групата със средна активност беше наречена „Ambivers“, те приеха средните показатели за активност, чувствителност ... и погрешно изчислиха: 67% от екстровертите (първата, най-общителната група), 41% от амбивертите и 23% от интровертите с разпределение на фотографски потвърдени покупки отговориха обективно на техните публикации:18, 7 и 8% при реално потребление: 26, 11 и 6%.
Екстровертите са по-склонни от другите да публикуват свои снимки, облечени с марката, в предните публикации, но не показват лоялност към търговците на дребно, които се опитват да угодят на отстъпките. Изглежда поведението им не е предизвикало верижни реакции, водещи последователи към магазините. Първоначалните хипотези не бяха потвърдени и не дадоха полезни модели.
Клъстерирането идентифицира четири стабилни групи жители на мрежата с предсказуеми модели на лично потребителско и мрежово поведение („Новаци“, „Адепти“, „Сдържани“, „Ентусиазирани“), но нито един от клъстерите не е имал значително влияние върху публикациите в собствената си група или в съседните. Проектът престана да бъде бавен.
Многобройни експерименти и хипотези с данните, посочени в профилите и числените параметри на интензивността на участие в дискусии, не дадоха резултати, така че беше решено да се откаже от анализа на личната информация, преминавайки към семантичен анализ на текстовете и компонентна оценка на снимки.
Снимките бяха качени в потока, нормализирани, завъртяни, подчертани и затъмнени, след което беше извършена независима оценка от трима експерти на последователни параметри:
Художествен вкус и оригиналност на композицията;
Общото впечатление за ентусиазъм и щастие върху лицата в кадъра;
Приветливост и степен на инвокативност на подписа под публикацията;
Наличието в снимката на елементи от логото на магазина, облеклото или марката;
Уместността на колекцията и съвместимостта на нещата в клуба на търговските марки на търговеца на дребно;
Споменаване на мястото на покупка, обективност на отзивите за облеклото, сравнителни степени в текста.
На втория етап анализирахме поведението на потребителите в точките на продажба, сравнявайки го с данни от мрежата. Wi-Fi в магазините, промоции на мобилни приложения за игри на трети страни (корпоративна отстъпка за обемни изтегляния) и RFID етикети помогнаха да се свържат артикули, донесени в пробните, но не закупени с мобилните телефонни номера на собствениците.
За всяка статия започна да се натрупва недостъпна преди това информация:
колко пъти представители на всеки клъстер са измервали и не са купували и по какви причини:
не седеше на фигурата;
не харесвам отпечатъка;
не отговаря на размера;
не стои добре с останалите дрехи;
колко подобни неща бяха донесени в пробната:
същия артикул, но различен цвят;
същата статия, но различен печат;
същия артикул, но различен размер;
колко свързани неща са внесени в пробната:
горна част за дъно или обратно;
други колекции или капсули.
Моделите започнаха да се появяват, когато бяха изградени веригите от клъстери: „Общителност“ (снимки и публикации) - „Профил“ (данни от въпросника) - „Опитване“ (успешност на обзавеждането в магазина) - „Успех“ (процент на придобивания след обзавеждане) - „Наблюдаемост“ (площ, етаж, тип изход).
Получихме две матрици от 1200 вероятности за всяка статия (3 „Общителност“ x 4 „Профила“ x 5 „Тестове“ x 5 „Късмети“ x 4 „Наблюдения“) - вероятността, че:
Именно този клиент ще закупи определен продукт в даден магазин.
Купувачът ще провокира верижна реакция на интерес и покупки сред онлайн приятели.
Имайки предвид разпределението на населението в магазините и успеха на продуктите сред клиентските клъстери, планирах да променя матрицата на асортимента, така че пристигащите клиенти да се сблъскат с повече посещения, но собственикът на международна верига за ежедневно облекло изпревари нетърпението ми:„Оставяте само попадения, а някои от тях неизбежно ще се превърнат в аутсайдери.“