Xác thực địa chỉ email với machine learning

Ngày đăng: 11/12/2019 3:12:19 AM - Tổng hợp - Hà Nội - 99
Chi tiết [Mã tin: 2820684] - Cập nhật: 39 phút trước

Một số vấn đề email là duy nhất và yêu cầu giải pháp tùy chỉnh. Trong khi các vấn đề khác phổ biến hơn và gây khó chịu cho người gửi của chúng tôi một cách thường xuyên. Đối với những vấn đề phổ biến này, phần mềm gửi email marketing đã ngày càng áp dụng các giải pháp học máy để tối ưu hóa việc gửi email của khách hàng.

Nhà cung cấp hộp thư đến theo dõi sự tham gia của bạn với người nhận. Nếu bạn liên tục gửi đến các địa chỉ email không hợp lệ, họ cho rằng email của bạn là không mong muốn. Các nhà cung cấp hộp thư đến sẽ phạt bạn và lọc thêm email của bạn để spam, làm tổn hại đến uy tín và khả năng gửi của bạn. Ngược lại, khi bạn gửi đến các địa chỉ email hợp lệ, nhà cung cấp hộp thư thưởng cho bạn vị trí hộp thư đến tốt hơn.

Cải thiện khả năng gửi bằng cách xác thực địa chỉ email mới trước khi bạn gửi cho họ
Các giải pháp xác thực địa chỉ email nội bộ và bên thứ ba hiện tại đã có những hạn chế. Chúng tôi thường nghe thấy từ khách hàng bày tỏ sự thất vọng khi cố gắng xác thực địa chỉ email. Họ dành hàng giờ để viết các biểu thức chính quy để phát hiện cú pháp xấu trong địa chỉ email chỉ để có chức năng giới hạn. Và đô la quý giá đã được ném vào các dịch vụ của bên thứ ba mà không thể truy cập tích hợp.

API thời gian thực này phát hiện các địa chỉ email không hợp lệ, như các địa chỉ bị nhập sai, không hoạt động, không tồn tại, dùng một lần hoặc chia sẻ. Chúng tôi làm điều này bằng cách tận dụng quy mô lớn của chúng tôi và khai thác sức mạnh của học máy.


Nghiên cứu của chúng tôi cho thấy rằng học máy là phương pháp chính xác, an toàn và đáng tin cậy nhất để xác thực địa chỉ email. Không cần lãng phí hàng giờ phát triển để viết các biểu thức chính quy dài, xấu xí mà chỉ kiểm tra lỗi cú pháp.


Dễ dàng tránh các chiến thuật spammer (chẳng hạn như bắt tay SMTP bị hỏng) mà các nhà cung cấp hộp thư cau mày. Học máy tự động học các mẫu trong dữ liệu, mà chúng ta không cần phải nghĩ và mã cứng mỗi biến thể có thể. Điều này dẫn đến mục tiêu cuối cùng của chúng tôi là giảm tỷ lệ thoát cứng , cải thiện danh tiếng với các nhà cung cấp hộp thư đến và tăng khả năng cung cấp tổng thể.

Cách chúng tôi sử dụng học máy tại Twilio SendGrid

Nhóm Khoa học dữ liệu của chúng tôi đã sử dụng mô hình mạng thần kinh để phân loại email không hợp lệ và hợp lệ để gửi email marketing. Họ đã áp dụng một lớp mạng thần kinh tích chập (CNN) và các lớp mạng thần kinh tái phát (RNN) để chụp và ghi nhớ các mẫu trong địa chỉ email.

Theo truyền thống, các CNN được sử dụng trong xử lý ảnh, nhưng được sử dụng ở đây để tạo dữ liệu n- chương trình của các chuỗi ký tự được đưa vào RNN. RNN có thể tìm hiểu các mẫu của các chuỗi ký tự mà nó sử dụng để phân biệt các địa chỉ email hợp lệ với các địa chỉ email không hợp lệ.

Cách tiếp cận này cho phép chúng tôi tìm hiểu các mẫu phức tạp hơn và đưa ra dự đoán cụ thể khi dữ liệu thay đổi.

Chúng tôi quyết định rằng chúng tôi đặc biệt muốn dự đoán các yếu tố sau, vì chúng là các trình điều khiển chính cho tính hợp lệ của địa chỉ email:


Cú pháp địa chỉ email : Địa chỉ email có cú pháp phù hợp, bao gồm tên người nhận, ký hiệu @, tên miền và tên miền cấp cao nhất (chẳng hạn như .com, .edu, .org) không?

Bản ghi MX và / hoặc A : Máy chủ thư và tên miền có tồn tại không và máy chủ có chấp nhận liên lạc qua email không?

Địa chỉ email vai trò : Địa chỉ email được sử dụng bởi một số người tại một công ty có vai trò được chia sẻ, như là sales sales@example.com.

Địa chỉ email dùng một lần : Đây có phải là địa chỉ email tạm thời mà người dùng sẽ không tham gia và vứt đi không?

Đập vỡ bàn phím : Người dùng đã vô tình hoặc vô tình nhập một chuỗi ký tự ngẫu nhiên và không thể hiểu được làm địa chỉ email?

Nghi ngờ và được biết là bị trả lại cứng : Đây có phải là một địa chỉ email đã được biết là bị trả lại trong quá khứ hoặc rất đáng ngờ để bị trả lại dựa trên việc gửi trước đó?

Mỗi địa chỉ email cá nhân được chuyển đổi thành một ma trận. Ma trận được đưa vào mạng lưới thần kinh nơi mô hình có thể nắm bắt thứ tự của các ký tự. Trái ngược với cách tiếp cận 'dựa trên quy tắc truyền thống của người Hồi giáo, một mô hình mạng lưới thần kinh có thể phát hiện các mô hình sẽ không xảy ra với chúng ta như con người do sự thiên vị của chính chúng ta.

Tiếp theo, mô hình tổng hợp các dự đoán mà nó đưa ra từ mỗi tính năng và đưa ra xác suất rằng một địa chỉ email không hợp lệ, sử dụng điểm số rủi ro là 0-100%. Sau đó, phân loại giữa các điểm số và xác định phán quyết tương ứng là Hợp lệ, Rủi ro hoặc Không hợp lệ.

Bạn có thể tích hợp API xác thực email với biểu mẫu đăng ký của mình và sử dụng sức mạnh của máy học để đưa ra quyết định sáng suốt về địa chỉ nào cần giữ và địa chỉ nào cần xóa. Tất cả các thông tin và lý do minh bạch cho điểm số có thể dễ dàng truy cập trong Twilio SendGrid UI.

Tất cả khách hàng API Email trên các gói Pro và Premier có thể tích hợp học máy vào gửi thực tiễn với API xác thực email! Tạo Khóa API trong bảng điều khiển Twilio SendGrid của bạn và kiểm tra tài liệu của chúng tôi để dùng thử công cụ miễn phí.

Tin liên quan cùng chuyên mục Tổng hợp