阳光沙滩
让学习编程变得简单
Android富文本编辑器,webview中提取HTML代码,去标签获得纯文字
发表于 2019-12-28    阅读次数 192

问题:webview中html内容提取纯文字。

富文本编辑器中,要读取html内容,想要获得输入文字的个数,html中有各种标签,有图片,有视频音频等,怎么提取纯文字呢。如下图

图片描述

方法

第一,获得html

html内容就要看你的代码了,获得它是第一位的了,就好像下图这样。

图片描述

第二,去除杂质:空格,各种html标签,用正则方法解决。

下面的words就是获得的纯文字了。

 String regFormat = "\\s*|\t|\r|\n";
 String regTag = "<[^>]*>";
 String words = html.replaceAll(regFormat,"").replaceAll(regTag,"");

第三,length()获得纯文字长度

int wordNumber = words.length();
Log.d(TAG, "  words  内容长度是-----》 " + wordNumber + "  words 输入内容是-----》 " + words);
String length = wordNumber+"";
mWordsNumber.setText(length);

注意setText(length)中的length是string类型,上面wordNumber是int类型,int转string直接加一个空字符串就OK了,我还犯了这个错误。

既然看到这里了,就来个

赞 吧!!!