Một điều quan trọng mà doanh nghiệp cần phải biết đó là cách doanh nghiệp làm khảo sát hoặc biểu mẫu sẽ ảnh hưởng đến câu trả lời mà doanh nghiệp nhận được. Các yếu tố ảnh hưởng đến câu trả lời trong khảo sát bao gồm từ ngôn ngữ được sử dụng khi đặt câu hỏi, thứ tự câu hỏi và tất nhiên một yếu tố quan trọng bậc nhất, đó chính là thang đo khảo sát – bao gồm các giá trị mặc định được sử dụng và phạm vi của thang đo.
Thang đo phản hồi được thể hiện trong khảo sát thông qua các lựa chọn trắc nghiệm, các thanh trượt, menu thả hoặc đơn giản là được lồng ghép trực tiếp vào câu hỏi khảo sát. Tuy nhiên, cho dù doanh nghiệp chọn cách hiển thị thang đo nào, các phạm vi mặc định đều ảnh hưởng đến độ chính xác của dữ liệu mà doanh nghiệp thu thập được. Ví dụ: nếu khảo sát đặt ra câu hỏi về tuổi tác của khách hàng, việc đặt phạm vi độ tuổi từ 20 – 30 thay vì 20 – 25 cũng có thể dẫn đến những phạm vi kết quả khác nhau.
Làm thế nào để thiết kế được một thang đo phù hợp nhất?
Khảo sát là một nguồn dữ liệu tuyệt vời giúp doanh nghiệp hiểu rõ hơn về thái độ và cảm xúc của khách hàng đối với thương hiệu của doanh nghiệp. Một số khảo sát cũng cho phép doanh nghiệp so sánh bản thân với đối thủ. Nhưng như Jared Spool – một chuyên gia về thiết kế phần mềm – đã lưu ý, những sắc thái và phạm vi khác nhau trong việc thiết kế thang đo khảo sát cũng đặt ra rất nhiều thách thức cho doanh nghiệp:
Tôi muốn nhấn mạnh rằng: thiết kế thang đo và lựa chọn điểm chuẩn sẽ ảnh hưởng đến câu trả lời của khách hàng – theo cả hướng tích cực và tiêu cực.
Đây là một trong những lý do chính khiến tôi hoài nghi về các tập dữ liệu so sánh giữa các công ty trong đó mỗi công ty sử dụng một công cụ khảo sát khác nhau. Có rất nhiều biến số trong việc phân tích những tập dữ liệu sử dụng những thang đo khác nhau, và việc đồng nhất chúng có thể gây ra những sai lệch không tưởng.
Vậy doanh nghiệp có thể làm gì để lựa chọn thang đo phù hợp nhất cho khảo sát khách hàng của mình mà vẫn đảm bảo tính chính xác của dữ liệu thu về? Công việc này phải được bắt đầu từ bước đầu tiên: Hiểu rõ các loại thang đo khác nhau.
3 loại thang đo dùng trong khảo sát khách hàng
Khi thiết kế khảo sát, có ba loại thang đo phản hồi khảo sát phổ biến:
- Thang đo nhị phân (Dichotomous scales): Thang đo này chỉ có hai lựa chọn, chẳng hạn như “Có” hoặc “Không”, “Đồng ý” hoặc “Không đồng ý”.
- Thang đo xếp hạng (Rating scales): Thang đo này cung cấp cho người trả lời nhiều lựa chọn để xếp hạng mức độ đồng ý của họ với một nhận định hoặc đánh giá về sản phẩm hoặc dịch vụ. Thang đo xếp hạng có thể có ba, năm, bảy hoặc nhiều điểm hơn.
- Thang đo trắc biệt (Semantic Differential Scales): Thang đo này sử dụng một cặp từ trái nghĩa để mô tả hai đầu của thang đo, chẳng hạn như “Tốt” và “Xấu”, “Dễ dàng” và “Khó khăn”. Người trả lời sau đó chọn điểm trên thang đo phản ánh mức độ đồng ý của họ với tuyên bố hoặc đánh giá.
Thang đo nhị phân
Như đã đề cập ở trên, thang đo nhị phân thường sẽ bao gồm hai lựa chọn đối lập nhau hoàn toàn. Ví dụ như:
- “Có” hoặc “Không”;
- “Đúng” hoặc “Sai”;
- “Công bằng” hoặc “Không công bằng”;
- “Đồng ý” hoặc “Không đồng ý”.
Không có cách nào để người trả lời có thể trung lập và đây có thể xem là một thế mạnh của thang đó này. Bởi theo nghiên cứu, trong các khảo sát, đặc biệt là các khảo sát dài, người trả lời thường sẽ gặp phải một vấn đề thường được biết đến như là “lỗi xu hướng trung tâm” (error of central tendency). Điều đó có nghĩa là càng nhiều câu hỏi thì người trả lời càng có xu hướng chọn những ý kiến trung lập hơn 2 ý kiến ở cực – và điều này thường không phản ánh chính xác suy nghĩ của họ.
Tuy nhiên, thang đo nhị phân cũng có khuyết điểm riêng của nó. Một lần nữa khi xét đến việc đưa cho khách hàng một khảo sát dài, nếu không có lựa chọn trung lập thì người trả lời cũng có xu hướng nghiêng về các câu trả lời tích cực hơn là tiêu cực, từ đó cũng gây ra những sai lệch đáng kể trong kết quả.
Thang đo xếp hạng
Doanh nghiệp có thể đã quen thuộc với thang đánh giá theo kiểu xếp hạng này. Một ví dụ về mẫu câu hỏi thường thấy khi sử dụng thang đo xếp hạng của doanh nghiệp là: “Trên thang điểm từ 1 đến 10, bạn hài lòng với dịch vụ của chúng tôi hôm nay như thế nào?”. Ngoài ra ba thang đo xếp hạng phổ biến nhất thường thấy là:
- Thang đo 1-10;
- Thang đo 1-7;
- Thang đo 1-5 (hay còn được biết đến như thang điểm Likert).
Vậy liệu có bất cứ sự khác biệt nào trong kết quả gây ra bởi thang điểm mà doanh nghiệp lựa chọn không? Hiển nhiên là có.
Các thang điểm càng lớn thì sự khác biệt cũng càng lớn, điều này đã lí giải vì sao thang điểm Likert trở thành thang điểm khảo sát phổ biến nhất trong ba loại thang đo trên.
Các nhà phân tích cũng đã khuyên rằng thang đo Likert cũng là thang đó nên dùng, trong đó điểm tích cực nhất là 5 và tiêu cực nhất là 1. Cho dù sử dụng thang đo nào đi chăng nữa việc đảo ngược thứ tự điểm số cũng là điều tối kị, các chuyên gia cho biết.
Thang đo trắc biệt
Thang đo trắc biệt thu thập dữ liệu và phân tích dữ liệu dựa trên nghĩa hàm ý của câu trả lời.
Trong loại thang đo này, hai thái cực thường xuất hiện nhất là “hài lòng” và “không hài lòng” – tuy nhiên sự phổ biến không đồng nghĩa với việc đây là cách đặt câu hỏi tốt nhất cho khách hàng – đặc biệt trong trường hợp doanh nghiệp đang muốn nghiên cứu trải nghiệm người dùng. Đó là bởi những gì doanh nghiệp thực sự muốn người dùng cảm nhận được là niềm vui sướng khi sử dụng sản phẩm hay dịch vụ của mình, chứ không chỉ dừng lại ở mức “hài lòng” và cách đặt tên các thang đo trắc biệt như vậy đôi lúc sẽ không phản ánh được chính xác nhất cảm xúc của người trả lời.
Thay vì vậy, khi sử dụng thang đo trắc biệt, doanh nghiệp nên cụ thể hóa hơn các tính từ được sử dụng và đặt chúng vào một ngữ cảnh cụ thể thay vì chỉ hỏi chung chung về cảm xúc của khách hàng. Ví dụ các cực đối lập mà doanh nghiệp có thể sử dụng bao gồm:
- Tiêu cực – Tích cực
- Phức tạp – Đơn giản
- Cũ – Mới
- Khó – Dễ
- Không đáng tin cậy – Đáng tin cậy
Doanh nghiệp nên sử dụng loại thang đo nào?
Rất rõ ràng, điều này hoàn toàn phụ thuộc vào loại dữ liệu mà doanh nghiệp muốn thu thập.
Thang đo nhị phân (“có” hoặc “không”) là một lựa chọn tối ưu nếu doanh nghiệp muốn thu thập những dữ liệu mang tính tuyệt đối, nhưng thang đó này sẽ không thể phản ánh mức độ cảm xúc của khách hàng và những lí do cụ thể dẫn đến một cảm xúc, đánh giá nhất định của họ về doanh nghiệp. Ví dụ, nếu doanh nghiệp hỏi khách hàng rằng liệu khách hàng có hài lòng với sản phẩm của doanh nghiệp không theo thang đo nhị phân, doanh nghiệp sẽ chỉ biết được một cực cảm xúc của khách hàng và không có nhiều thông tin chi tiết về những vấn đề cụ thể mà khách hàng được đối mặt để có thể thực sự cải thiện trải nghiệm của họ.
Trong trường hợp muốn đo lường chính xác trải nghiệm của khách hàng, thang đo xếp hàng (thường được dùng trong khảo sát NPS) sẽ là một lựa chọn tối ưu hơn nhờ phạm vi tăng dần của thang đó cho phép người dùng chỉ ra cảm xúc cụ thể của họ. Tuy nhiên, đây cũng có thể là một điểm yếu của nó, bởi việc dàn trải thang đo để nhìn rõ hơn vào ý kiến cụ thể của mỗi khách hàng sẽ khiến dữ liệu doanh nghiệp thu thập được thiếu tính tổng quát hơn.
Ngoài ra, thông tin càng mang tính định lượng cao (ví dụ như câu hỏi về hành vi) thì phạm vi của thang đó càng nên được thu hẹp. Ví dụ, khi doanh nghiệp muốn đo lường thái độ hoặc cảm xúc của khách hàng, việc sử dụng thang đo với mức 5 điểm hoặc 7 điểm là một lựa chọn tối ưu so với thang điểm 10.
Ngoài ra còn có một thang đo cũ hơn cũng thường được sử dụng – đó là thang đo Guttman – sự kết hợp giữa thang đo nhị phân và thang đo Likert. Doanh nghiệp có thể hỏi một loạt các câu hỏi dựa theo sự tăng dần về mức độ so với câu hỏi ở trước nó.
Những hạn chế của các loại thang đo
Ngay cả khi doanh nghiệp tưởng như mình đã thiết kế được một khảo sát hoàn hảo với các thang đo phù hợp, thì vẫn luôn có những hạn chế tồn tại. Điều này được phản ánh rõ rệt nhất nếu doanh nghiệp chỉ cho chạy một loạt các khảo sát trong một phạm vi giới hạn hoặc thực hiện các khảo sát một cách rời rạc (và không có các hình thức nghiên cứu chuyển đổi khác hiệu quả hơn).
Ý nghĩa của những con số
Khi doanh nghiệp cho chạy một khảo sát với thang đo như khảo sát NPS, thu thập sẽ thu được một loạt dữ liệu dưới dạng số. Doanh nghiệp hoàn toàn có thể sử dụng những con số này để so sánh với đối thủ cạnh tranh cũng như số điểm mà doanh nghiệp đạt được trong các khảo sát trước đây, nhưng nó sẽ có những hạn chế nhất định trong việc phản ánh chính xác cho doanh nghiệp hiểu được về trải nghiệm người dùng của mình.
Điều đó có nghĩa là các thang đó có thể cho doanh nghiệp biết rất nhiều thông tin, nhưng không có nghĩa là doanh nghiệp có thể biết tất cả các thông tin về trải nghiệm khách hàng chỉ nhờ vào một thang đo duy nhất. Như Caroline Jarett đã từng nhận định:
Khi khảo sát NPS, doanh nghiệp phải thật sự hiểu và biết rằng liệu câu hỏi đó có ý nghĩa với người trả lời và phản ánh được đúng suy nghĩ của họ như doanh nghiệp mong muốn hay không. Nói đơn giản, có những sản phẩm mà người tiêu dùng sẽ thật sự yêu thích nó và một khi doanh nghiệp đã cho họ những trải nghiệm như vậy, họ sẽ sẵng sàng giới thiệu sản phẩm đó cho một người bạn – tức NPS đã thật sự phản ánh được một phần trong trải nghiệm người dùng.
Nhưng ngược lại, có những sản phẩm cho dù sử dụng tốt đến đâu, người ta cũng sẽ không hoặc hiếm bao giờ chia sẻ nó với bạn bè của mình – ví dụ như kem trị bệnh hói chẳng hạn – sẽ hiếm ai thật sự giới thiệu với bạn bè của mình sản phẩm này, và do đó NPS không thật sự phản ánh đúng giá trị của sản phẩm đó.
Chính điều này yêu cầu doanh nghiệp phải thật sự linh hoạt trong việc sử dụng các thang đo và hiểu được bản chất của sản phẩm hay dịch vụ mà mình cung cấp trước khi thực hiện bất cứ khảo sát nào.
Thay đổi nhỏ, ảnh hưởng lớn
Hầu hết mọi yếu tố đều có thể ảnh hưởng đến kết quả của một cuộc khảo sát, đó là lý do tại sao nhiều chuyên gia nhấn mạnh việc rất khó để có thể đưa ra được một tập dữ liệu so sánh chính xác.
GreatBrook, một công ty tư vấn nghiên cứu, đã thực hiện một thí nghiệm với một số khách hàng. Trong thí nghiệm này, họ thiết kế ra một loạt các khảo sát có cùng nội dung, chỉ khác nhau về thiết kế thang đo. Họ đã đưa các phiếu khảo sát cho 10.000 người và phát hiện ra một số điều thú vị:
- Cung cấp thang đo số với mốc chỉ cho các điểm đầu cuối (ví dụ: thang điểm 1-5 có mô tả bằng lời cho các điểm đầu cuối 1 và 5) khiến nhiều người chọn các điểm ở hai cực hơn.
- Trình bày thang điểm dưới dạng một loạt các mô tả bằng lời (ví dụ: “Bạn có cực kỳ hài lòng, rất hài lòng, khá hài lòng, khá không hài lòng, rất không hài lòng hoặc cực kỳ không hài lòng không?”) dẫn đến sự phân tán nhiều hơn trong câu trả lời của khách hàng.
- Thang điểm chữ (ví dụ đánh giá một sản phẩm dựa trên thang từ A đến F) là loại thang đo dẫn đến sự phân tán nhiều nhất.
Như vậy, doanh nghiệp cần chú ý đến những tiểu tiết nhỏ nhất trong việc thiết kế khảo sát để đảm bảo tính chính xác cho dữ liệu của mình.
Sử dụng ngôn ngữ và thang đo phù hợp
Đối với một số thông tin nhất định (ví dụ như độ tuổi), có nhiều cách để doanh nghiệp có thể đặt câu hỏi cho khách hàng. Mỗi cách sẽ tạo ra một mức độ chính xác khác nhau.
Theo MyMarketResearchMethods.com, nếu doanh nghiệp muốn khảo sát độ tuổi trung bình, hãy sử dụng thang đo tỷ lệ (ratio scale) thay vì thang đo danh nghĩa (nominal scale).
Ví dụ khi khảo sát về mức thu nhập, nếu đối tượng là các sinh viên đại học, các con số nên được đề ra ở mức thấp hơn. Nếu đối tượng khảo sát là những người lớn tuổi hơn, các con số có thể được nâng cao dần tùy theo mức sống ở quốc gia mà doanh nghiệp đang nghiên cứu.
Theo lời khuyên của Balon, “Đối với bất kỳ đối tượng nào bạn đang nghiên cứu, hãy đảm bảo rằng những con số phù hợp với các đặc điểm của đối tượng nghiên cứu để tránh tạo ra sự thiên vị bổ sung (additional bias)”.
Tương tự như vậy, việc viết các cuộc khảo sát bằng ngôn ngữ mà khách hàng đang sử dụng là điều quan trọng. Sử dụng các cụm từ, thuật ngữ chuyên môn và giọng văn mà khách hàng của doanh nghiệp thường hay dùng, đó là cách khiến khách hàng hứng thú với khảo sát hơn.
Lời kết
Mặc dù các khoảng giá trị mặc định cho các câu hỏi khảo sát có vẻ được đưa ra rất ngẫu nhiên, nhưng có rất nhiều ý nghĩa đằng sau mỗi thang đo yêu cầu doanh nghiệp phải thật sự cân nhắc kĩ càng trước khi lựa chọn. Cho dù doanh nghiệp sử dụng thang đo Likert, thang đo nhị phân hay thang đo trắc biệt – tất cả đều cần phụ thuộc vào mục tiêu và đối tượng nghiên cứu của doanh nghiệp.