网站出路
每一次打开COSMOS子站,我都在想一个问题:这样的网站的出路是什么?
我的目的不是把这个网站做大,不是想让它流行起来。我的目的很简单,如何为大家提供在其他的天文或者宇宙方面的网站中所找不到的内容。而且我自己有一个要求,就是要求内容要足够的收敛。我不想让整个网站看起来像是一盘散沙,没有主题。还有一个很重要的要求是,要简洁(简单+整洁)。
然后确定了上面的问题,还要想,在内容的产生上,到底是要定位在精英写作,还是大众合作?在内容的管理上,到底是网站管理,还是要加上用户的管理(也就是要加上方便用户分类标记等的功能)?
假如我暂时定位在精英写作和网站自己管理内容上,然后看一下现在的网站的状态,那么可以写出下面的一个内容架构吧。
支架:CMS(Drupal)
服务层:Book+Article+Comment
内容组织:网站主导的:Book+Tag(暂时没有)+CrossRef;用户管理:目前只有comment的管理,基于disqus。
事实上,在思考上面的问题之前,应该首先想,到底是要建立一个服务型的,还是内容型的网站。如果是服务型的,自然用户的内容管理要重要的多。如果是内容型的,按照目前的趋势,一定要加入用户内容管理的模块,而且要加上sns的特性。但是这种方式可以走多远?
我现在还没有找到一个好的发展方向。目前个人更加倾向于基于内容的网站,那么下面的问题是到底要放置什么内容?我原本的想法是,放些宇宙学的知识。而且我想,网站不能放置那种流行的新闻,必须要专业,准确。总结起来说,就是要做一个高级科普。那么这样一个高级科普到底应该怎样活起来?可以确定的是,普通的加社会化元素的方法是不合适的,因为没有那么多的受众,而且我很讨厌这样来浪费别人的时间。所以我觉得,这样的网站不应该讨论活的问题,不应该把重点放在如何增加知名度上,而是应该放在如何提高内容质量和管理条目上。
这样说来,其实我做的很像是wiki book的一个子项目啊~好吧,那么如何做到不要在内容上跟wiki book重复呢?这个我真不知道……我想,这条路也是暂时的吧,因为这样一个网站怎么看都像是redundant的……
其实,有时候我也在想,未来会出现什么样的网站体系(或许未来的网站不仅仅是网站了)。或者说,有了各种sns,有了wiki,有个news,我们还需要什么样的网站?
首先我自己是很讨厌sns这种耗费掉很多时间的网站,我也不是很关心news,但是我还是身不由己的加入了sns的大军,而且也会跑到news的网站去看新闻,当然wiki对我来说很重要,如果有好的wikibooks那更好。想想,这些应该就是我生活的全部了吧。
但是这些网站并不是完美的。比如我常常抱怨豆瓣输入公式不方便。(如果有一个类似豆瓣的科研人员社区倒是很不错。如果豆瓣同意为某些小组做一些特殊话的处理就好了,比如小组可以申请豆瓣专门为小组添加latex的解析功能……我还是不要歪歪了吧……)
前些天我跟小田谈过,想建一个算是智能型的网站,就是每个人看到的内容都是不同的,也就是说这个网站对不同人来说是不一样的,并且整个网站应该是富有乐趣的。网站的智能是说,在新闻输出方面(我不知道该怎么表达,反正就是网站把信息告诉网民,这是网站最本质的作用),这个网站能对海量信息进行处理,并把你感兴趣的挑选出来,而且同一篇新闻报道能按不同的教育水平给出多个版本,这样网民既能不浪费时间的获取信息,又能在自己理解水平内明白新闻的内容。我现在还没有仔细想过,就说这一个吧。在用户反馈方面(就是针对所阅读的新闻进行评论)也应该把用户的评论进行分类整理,譬如,现在的评论若有几十项,别人再看时,就需要一一查看,而其中有很多对别人来说都没有用,往往只有三两条评论能给别人带来用处。所以,不同的人看到的评论也应该是不同的,这需要网站作出分析。
最终整个网站就像自己的另一个大脑一样,它将承担人的信息获取需求,我拟定的网站名称就叫大脑网,应该给网民提供最合适的新闻。
以前去过一个网站,就可以帮助我们处理信息的,跟你说的很相似,不过那个网站需要你实现高速它你喜欢什么样的新闻或者文章,然后它会慢慢的学习。我怎么也想不起是什么网站来了……以后找到了给你看看~
嗯,其实这就是web 3.0 的内涵吧,web 2.0是一个信息爆炸的时代,马上就要到来的web3.0应该是一个在整体上信息爆炸但是对给个人来说,一个信息收敛的时代。
我很支持你的这个设想,我觉得如果能在算法上胜出,现在就开始建一个这样的网站是很有前途的。关键是如何要让用户觉得方便,就像jobs说的一样,一个后pc时代,应该是用户什么都不用管的时代啊~
当然,在近未来,就像他们说的一样,LBS应该会有很大的发展,因为这也很符合你提到的,将特定的信息推送给特定的人~
我比较建议你改一下头像……或者使用一个有你的头像的sns站点登录……
找不到头像在哪儿更换。
好吧,那就算了~
我记得看过一文章,说可以给搜索结果评级(内容深度)。按这个思路,可以给网站索引的所有的文章评级,然后提供给相应用户。当然用户阅读不同类别的文章能达到的深度不一,所以分类很重要,再有就是网站应该有一个学习的过程,比如提供给用户文章的同时,可以让用户按内容深度适中偏难偏易评分。这样使用越多越准确。
最后,现在很多研究这方面东西的,我忘了那个术语叫什么了,反正就是为每个用户提供适合自己的内容,简单地,像豆瓣猜。
就像是很多的音乐网站一样,先做一个小测验,然后可以给出你喜欢的歌曲。
或者豆瓣电台,可以学习的~而且据说豆瓣电台还有惊喜的机制,就是不仅仅提供自己喜欢的那种,偶尔会给点惊喜……
但是这个还不够,肯定还有很多其他的要完善的……用户不仅仅需要对信息进行分类,分完类,评完级别肯定还有很多吧,你应该注意到我的related posts后面有个数字吧,那个是相似度的~
如果只是做了上面的事情,那么就仅仅是在rss reader上面添加了很小的一点修正啊……肯定还有更多的可以做的事情~
我觉得李白这个想法很好,如果能够合适的实现这个想法,是很有前途的~
我仍然觉得分类是最基础的东西,这个做不好,之后的信息提取会很困难。不过分类只是相对的,之间的联系什么的会变化,处理起来也很麻烦。真要具体实现会面对一大堆问题。
数学不好,不然可以简单模拟一下……
分类也许是很重要的吧,但是我总觉得这条思路往下走会很麻烦~
这里会不会有一个会有基于不同的标准来分类的为问题啊~因为可能要从不同的角度来看这个文章嘛~
我在想,我们看到什么东西的时候,会感觉跟另一个很像,难道我们在存储过去的信息的时候分过类了么?也许分过类了,但是我不太相信啊~我觉得应该是东西全都放在那里了,乍一看去乱七八糟,但是大脑应该是有一个比较好评分系统,然后直接从乱七八糟的东西里面提取出来了吧~
不过,如果我们摄取信息的时候是按照类别来摄取的,那么大脑提取信息的效率应该更高,所以你说的一个个也没错,分类很重要。
但是我想,应该有另一个事情也很重要,就是tag系统,我觉得采用tag系统来提取信息可以比较高效率一点,但是准确度可能不高。具体的是,对每一件事情加很多的tags,然后信息提取的时候,按照tags给出的信息来提取。但是tag系统应该怎么设计,才能使得提取出来的信息准确?我没有好的办法,但是我觉得现在这种直接线性的按照有什么tag没有什么tag来取出来不好。
还有,tag系统还有一个好处,就是信息的自动聚集。比如blog里面,有很多的posts,每一个post有很多tags,然后我们可以把这些posts汇总,然后就像我的blog右边一样,posts多的就显示的大(当然也可以用另一个指标来表示),反之就小。这样的话,不再需要考虑该怎么分类了,tags已经自动的为我们分好了类别。也不会出现我们人为规定了类别,然而这个类别却没用到的情况~
嗯,tag系统很强大,豆瓣猜应该就是基于这个的。我说的分类和tag有相似的地方,都是为了对信息做出区分。不过我觉得现在的tag都过于随意,而且很少考虑tag之间的联系,比如要是某篇小说我标了科幻,另一篇标了赛博朋克,这两篇小说的相似程度要超过不同程度,但tag上体现不出来。像豆瓣这样的,用户量很大,经过统计学习可能会好一点。
其实我一直不知道统计/学习的方法更重要还是知识库/规则的方法更重要。当然我知道结合起来是最好的。
我是这样想的,按李白的想法,网站要能自动为不同的人提供最适合他的信息,这样就省掉了个人搜集鉴别筛选的过程。而如果网站真能完美做到这一点,它肯定具有与人相当的智能(行为上,某种层面),单纯的tag应该还不行。
另外,大脑提取信息是更像关键词搜索呢,还是更像查找已知路径的文件?这个可以做实验么……
我昨天晚上还在想,如果tag加的很随意,那么怎么把这么表面上不同的tag合起来。然后我就想到了google。
其实想想,掌握了搜索,其实在某种程度上酒掌握了信息的提取。比如我们利用google news,让用户告诉我们他们对哪些关键词感兴趣,那么就让google news去搜索,那么返回来的新闻应该大部分都是他们想看的吧。
我还想到,其实上面这些讨论还是相当于在做一个rssreader,不过不是基于rss的,而是基于全部站点的。
分类的想法还是不够好,我想这也应该是为什么gmail,gdoc开始换用tag的原因吧,tag可以包含分类,但是又有很多分类所不具备的优势。我还是觉得信息的自动组织是很大的优势啊~
上面那个不能回复了……
确实像rss reader,基于全站点和tag的……
前边可能没说清,我想的分类也是自动完成的,仔细想其实和tag差不多。就是机器可以自动识别文章之间的相似度和相异度,然后添加类别tag(多tag,有各自的相关系数)。tag不需要人为给出,因为需要的只是区分,命名是次要的。再有就是如何处理tag之间的关系,这个也要有很好的算法才行。
我一直觉得自然语言处理很重要,可惜比较笨,考了两年计算所都没考上,山大也没这个方向。不知道以后还有没有可能做这个。
google账户登录没头像,于是改豆瓣了。
google登录有头像的啊~我能看到的~
嗯,这么说我们应该说的是一样的东西……
其实我很想尝试做一个超前的网站……可是没思路啊~
咦?竟然用人人网帐号登上了。我看看有没有头像,要是没有,就再换其它的试试。
我不知道为什么你这个这么奇怪啊~
人人网的无头像,再试一下豆瓣的。
豆瓣的也没有,这是怎么回事?
我还是用管理员身份的吧,不用你审核就可以显示评论。
评论不是每次都需要审核的,只要审核过一次,下一次就自动通过了。所以你用其他的也可以。