UMUX(Usability Metric for User Experience)は、製品やシステムのユーザビリティを測定するために開発された、簡潔かつ信頼性の高い標準化質問票である。ユーザー体験を構成する「有効さ」「効率」「満足度」という側面を、わずか4つの質問で定量的に評価する。
高速な開発サイクルにおいて、主観的な感想だけでなく客観的な指標で製品価値を迅速に検証し、データに基づいた意思決定を下すための強力なツールとなる。
ユーザビリティの3要素を捉える設計思想
UMUXは、ISO 9241-11で定義されるユーザビリティの3つの構成要素、すなわち「有効さ(Effectiveness)」「効率(Efficiency)」「満足度(Satisfaction)」をバランス良く測定するよう設計されている。
これは、単に「使いやすい」という主観的な満足度だけでなく、ユーザーが目的を達成できたか(有効さ)、その過程はスムーズだったか(効率)という客観的な側面も捉えることを意図している。肯定的な表現の質問2つと否定的な表現の質問2つを組み合わせることで、回答者の本音を引き出しやすい構造になっている点も特徴である。
語源・提唱者
UMUXは、2010年にインテル社のKraig Finstadによって提唱された。当時すでに広く利用されていたSUS(System Usability Scale)への課題意識があった。
SUSは10項目の質問から成る信頼性の高い指標だが、Finstadはその質問項目がユーザビリティの3要素を均等に網羅しておらず、特に「満足度」の側面に偏りがちであると指摘した。この課題を解決し、ユーザビリティの定義により忠実で、かつSUSよりも短い質問票を作成する目的でUMUXは設計された。
Kraig Finstad
https://www.linkedin.com/in/kraig-finstad-2391474/
少ない負担で信頼性の高い評価を実現
UMUXが実務で重宝されるのは、ユーザーへの負担を最小限に抑えつつ、信頼性と比較可能性の高いデータを取得できる点にある。これにより、限られたリソースの中でも迅速かつ的確に製品の状態を把握し、改善活動へと繋げることが可能になる。
* 評価の多角性
ISOの定義に準拠しているため、単なる使いやすさの印象だけでなく、ユーザーが目的を達成できたか、効率的に操作できたかといった多角的な視点からユーザビリティを評価できる。
* 既存指標との比較可能性
算出されるスコアは、業界標準であるSUSのスコアと非常に高い相関関係を持つことが研究で示されている。これにより、過去に蓄積されたSUSのデータや、業界ベンチマークとの比較がある程度可能となり、自社製品の立ち位置を客観的に把握する助けとなる。
4つの質問から100点満点のスコアを導く
UMUXのスコアは、4つの質問項目への7段階評価(1:まったく同意しない〜7:強く同意する)の回答から、標準化された計算式を用いて0から100の範囲に変換される。具体的な算出フローは以下の通りである。
質問事項
- [このシステムの]機能は私の要件を満たしています。
- [このシステム] を使うのはイライラする経験です。
- [このシステム]は使いやすいです。
- このシステムでは、修正に時間がかかりすぎます。
計算方法
1. 奇数番目の質問(肯定文)のスコアを算出する。
回答値から1を引く。(スコア = 回答 – 1)
2. 偶数番目の質問(否定文)のスコアを算出する。
7から回答値を引く。(スコア = 7 – 回答)
3. 4つの質問のスコアを合計する。
この合計値は0〜24の範囲となる。
4. 合計値を正規化し、100点満点に変換する。
算出した合計値を24で割り、100を掛ける。(最終スコア = (合計スコア / 24) * 100)
補足:なぜこの計算式を用いるのか
一見複雑に見えるこの計算式は、個々の回答データを「100点満点の成績表」として、誰もが直感的に理解できるようにするためのものである。具体的には、以下の3つのステップで処理を行っている。
-
スタート地点を「0」にする
アンケートの選択肢は「1〜7」だが、計算の便宜上、すべての回答から1を引く。これにより最低点が「0点」、最高点が「6点」という扱いになり、積み上げ計算が可能となる。 -
ネガティブな質問の点数を反転させる
(偶数問) 偶数番目の質問は「使いにくい」「複雑だ」といったネガティブな内容を問うている。これらに「7(非常にそう思う)」と答えるのは、製品評価としては0点の状態を意味する。そのため、計算式を用いて「7なら0点」「1なら6点」となるように点数を反転させ、ポジティブな質問と評価の向き(数値が高い=良い)を統一している。 -
世界標準の「100点満点」に換算する
4問すべて満点(6点)だった場合の合計は24点である。この合計点を24で割り、さらに100を掛けることで、0点〜100点のスコアに変換している。これにより、業界標準であるSUSスコアと同じ物差しでの評価・比較が可能となる。
デザイン改善の効果を数値で証明する
UMUXの最も強力な活用シーンは、デザイン改善施策の効果を定量的に示す場面である。
例えば、モバイルアプリの特定フローを改善するプロジェクトにおいて、施策の前後でUMUX調査を実施する。
改善前の平均スコアが「48」であったのに対し、新しいUIで再度調査した結果「75」へと向上した、といった具体的な数値データを得ることができる。
この「+27ポイント」という客観的な指標は、「使いやすくなったはずだ」という主観的な主張を裏付ける強力な証拠となる。
これにより、デザイン変更の妥当性と投資対効果を、経営層や他部門のステークホルダーに対して疑いの余地なく証明でき、円滑な合意形成を促す。
UMUX-Lite:さらなる軽量化指標
UMUX-Liteは、UMUXの4つの質問をさらに2つに絞り込んだ超軽量版である。主に「機能が要求を満たしているか(有効さ)」と「使いやすいか(使いやすさ)」の2点のみを測定する。
質問数が極めて少ないため、UXの継続的なモニタリングや、回答負荷を極限まで減らしたい大規模調査に適している。UMUXと同様、SUSスコアと高い相関性を持つことが確認されており、信頼性を維持しつつ機動力の高い評価を可能にする。