トップページ > 大学の技術・ノウハウ > セッションログのトークン分割の自動化 ~マーケティング分析の効率化~

大学の技術・ノウハウ

セッションログのトークン分割の自動化 ~マーケティング分析の効率化~

資料

セッションログのトークン分割の自動化_電気通信大学 岡本一志

組織名 電気通信大学 大学院情報理工学研究科 情報学専攻  岡本 一志 准教授
技術分野 IT , その他
概要

ユーザ行動ログ(Web閲覧・アプリ操作・情報探索行動など)は情報検索最適化、レコメンダ、行動分析、パーソナライゼーションのため、多くの分野で活用されています。一方で、現在のユーザ行動ログは連続的で境界が曖昧なため、データが大量に発生し、リアルタイム処理や機械学習モデルの学習に高い計算コストがかかるという課題があり、複数の目的指向タスク(セッション)のトークン分割自動化が求められています。
研究者は、「前後の行動の類似度ベースの分割法」に加え「形態素解析技術」を参考に、セッションデータ中の分割点を自動検出し、トークンに分割するセッション・トークナイザーを開発しましました。このセッション・トークナイザーを活用することで、少ない計算コストでセッションデータ分割を効率的に行うことができ、ユーザ行動分析や推薦システム等、時系列データ解析の効率化・高精度化を実現します。

お問い合わせ

この技術・ノウハウに関するお問い合わせ

詳細

【間略図】

【背景】

近年、ECサイトや動画配信サービスにおけるレコメンデーションシステム(推薦システム)は、ユーザ体験を向上させる重要な要素となっています。特に、ユーザの過去の閲覧履歴や行動パターンをもとに、関心のありそうな商品・コンテンツをリアルタイムに提示することが求められています。中でも、セッションベースの推薦システム(以下、SBRS)は、ユーザが1回の訪問中に行う一連の行動(セッション)に着目し、短期的な興味・関心に基づいて推薦を行う仕組みです。

従来のSBRSは、ユーザの行動履歴を使用して推薦を行いますが、ユーザの好みは短期間で変動するため、人手によるラベル付けや動的に推薦モデルを更新する必要があります。しかし、頻繁なモデル更新は高い計算コストを伴い、リアルタイムで効率的にシステムを運用することが難しくなる場合があります。個々のユーザの短期的な嗜好変化に即応しつつ、計算コストを抑えたパーソナライズドSBRSを提案することが求められています。

【技術内容】

本技術では、個々のユーザの短期的な嗜好変化に即応しつつ、計算コストを抑えたパーソナライズドなセッションベースの推薦システム(以下、SBRS)を提案するため、セッションデータ中の分割点を自動検出し、トークンに分割します。

具体的には、行動ログ(クリック、視聴、購入など)の前後の行動パターンを比較し、急激な“意味の変化”があるところをセッションの切れ目(分割点)とみなす手法「前後の行動の類似度ベースの分割法」に加え、自然言語処理の基本かつ重要な前処理手法として、日本語を中心に広く使われている「形態素解析技術」をテキストではなく行動ログに応用し、セッションデータのトークン化の自動化を実現しました。

これは、文章の“読みやすい区切り”を見つける技術を、行動データに応用することで、短期的な興味・関心に基づいて推薦を行うSBRS等、時系列データ解析の効率化・高精度化に寄与する研究成果です。

 

本技術は、現在の既存の推薦システムや分析システムの前処理として組込める可能性やLLMを活用した推薦システムにおけるトークン化としても有効です。分析業務の効率化/少人数でも大規模データに対応可能な分割支援ツールの実現として、是非ご活用ください。

 

【技術・ノウハウの強み(新規性、優位性、有用性)】

・形態素解析の「構造を読み解く力」を行動データに応用し、高速かつ柔軟な分割を実現します。さらに、「行動の流れ」の中に潜む構造を抽出するため、ドメイン特化ルールに依存しにくいため、潜在的タスク境界をより高精度に推定できる可能性があります。

・分析の属人性を排除し、誰でも一貫した処理を可能にします。

・高精度なセッション分割は、検索意図推定(Intent Modeling)やレコメンド(セッションベース協調フィルタ)、
行動異常検知(異常境界パターン)、マーケティングアトリビューション改善(多接点分析)、学習分析(学習行動のタスクまとまり抽出) への直接寄与等、マーケティングだけでなく、UX設計・離脱分析など多様な活用シーンに展開可能です。

 

【連携企業のイメージ】

・Web・アプリのユーザ行動ログを日常的に収集・分析されている企業
・クライアント企業の顧客データを統合・分析する基盤を提供されている企業

【技術・ノウハウの活用シーン(イメージ)】

・Web・アプリのユーザ行動ログを日常的に収集・分析の高精度・効率化
・広告配信における行動ターゲティングの粒度向上
・P2Pプラットフォーム(Peer-to-Peer)等のやりとりの行動構造のモデリングに活用
・ヒートマップ/ユーザ行動分析ツールでの分割最適化

 

【技術・ノウハウの活用の流れ】

本研究にご興味があれば、お気軽にお問い合わせください。連携に向け、ご面談等のアレンジが可能です。

 

【専門用語の解説】

セッションデータ:ユーザが特定のサービスやシステムを利用する際の一連の操作や行動を記録した、ウェブサイトの閲覧履歴、
アプリの使用履歴、オンラインショッピングの購入履歴などのデータ。

トークン:行動系列における一定の行動のまとまり。

トークナイザー:データをトークンに分割する処理を行うツールやアルゴリズム。

形態素解析技術:自然言語処理(NLP)の分野において、文章を意味のある最小単位(形態素)に分割し、
それぞれの品詞を分析する技術。

 

キーワード:セッションベースの推薦システム(Session-Based Recommender System)、セッション分割(Session segmentation / Sessionization)、処理速度(Tokens/sec)、トークナイゼーション (Tokenization)

セッションログのトークン分割の自動化_電気通信大学 岡本一志

この技術・ノウハウに関するお問い合わせ

メールフォームのご利用は、以下の項目にご記入のうえ「送信する」ボタンを押してください。
担当者より折り返しご連絡いたします。
個人情報の取り扱いについては、こちらをご覧ください。


    お名前(漢字表記) 姓 名 
    お名前(ふりがな) 姓 名 
    学校・会社・団体名 (例)株式会社キャンパスクリエイト
    部署名 (例)営業部
    郵便番号
    都道府県
    市区町村番地 (例)調布市調布ヶ丘1-5-1
    建物名 (例)調布ビルディング1階
    お電話番号 (例)042-490-5728
    メールアドレス (例)sample@campuscreate.com
    お問い合わせ内容

    技術・ノウハウを検索する

    掲載記事のお問い合わせ、技術相談など、お気軽にご相談ください。

    メールでのお問い合わせ

    株式会社キャンパスクリエイト
    調布オフィス 担当:須藤 慎

    〒182-8585
    東京都調布市調布ヶ丘1-5-1
    国立大学法人 電気通信大学
    産学官連携センター内[地図