好,我解释下。(1/2)||Ax-b||^2_2求二阶导:transpose(A)*A(Hessian),因为A是overcomplete,所以存在非零向量x,使得Ax=0,这样transpose(A)*A半正定(这里要说抱歉:我指的Hessian阵半正定是这一部分。);对于1范数,确如博主所言,在零分量不可微,那我们从严格凸的定义解释:举个反例:x_1=transpose([0,0,...,0]),x2=transpose([5,5,...,5]),for every a in (0,1),||(1-a)x1+ax2||_1=(1-a)||x1||_1+a||x2||。
pluskid(2013年9月6日)
你好,不好意思,你说得没错。||Ax-b||^2 确实当 A overcomplete 的时候 Hessian 半正定的。严格凸能够保证解的唯一性,但是非严格凸并不一定就会解不唯一。当然对于这里来说还是有可能出问题的,如果 Ax - b = 0 定义的 affine 子空间和 L1-ball 的边界平行了的话,确实就解不唯一了,这一点之前都没有考虑过。
主题: Re: New comment posted on Equivalence of Several L1 Sparsity Problem
Settings
A new comment was posted on Free Mind
pluskid
l0 和 l1 在一些前提下的等价性可以参见 Compressive Sensing 相关的内容。
8:46 a.m., Monday Nov. 25
Reply to pluskid
pluskid’s comment is in reply to lemon:
博主,你好强大的说。有没有关于l0等价性的证明或者相关结论呢?
Read more
You're receiving this message because you're signed up to receive notifications about replies to disqus_sywwrYZcr6. You can unsubscribe from emails about replies to disqus_sywwrYZcr6 by replying to this email with "unsubscribe" or reduce the rate with which these emails are sent by adjusting your notification settings.
主题: Re: New comment posted on Equivalence of Several L1 Sparsity Problem
Settings
A new comment was posted on Free Mind
pluskid
不同的非零项可以解出相等的 lambda 啊。
8:27 a.m., Monday Dec. 2
Reply to pluskid
pluskid’s comment is in reply to lemon:
博主你好,在推导URLS问题和LASSO问题的逆向 映射时,用到下面这个公式,针对每一个不为0的分量,都可以解出一个lambda,但是lambda的值只能有一个,这不就等于要求最优解只能有一个非零项吗?这样的要求不合理呀! Read more
You're receiving this message because you're signed up to receive notifications about replies to disqus_sywwrYZcr6. You can unsubscribe from emails about replies to disqus_sywwrYZcr6 by replying to this email with "unsubscribe" or reduce the rate with which these emails are sent by adjusting your notification settings.
主题: Re: New comment posted on Equivalence of Several L1 Sparsity Problem
Settings
A new comment was posted on Free Mind
pluskid
不同的非零项可以解出相等的 lambda 啊。
8:27 a.m., Monday Dec. 2
Reply to pluskid
pluskid’s comment is in reply to lemon:
博主你好,在推导URLS问题和LASSO问题的逆向 映射时,用到下面这个公式,针对每一个不为0的分量,都可以解出一个lambda,但是lambda的值只能有一个,这不就等于要求最优解只能有一个非零项吗?这样的要求不合理呀! Read more
You're receiving this message because you're signed up to receive notifications about replies to disqus_sywwrYZcr6. You can unsubscribe from emails about replies to disqus_sywwrYZcr6 by replying to this email with "unsubscribe" or reduce the rate with which these emails are sent by adjusting your notification settings.
Comments
大神您真是太helpful了。。前一阵看HMM和CRF,您就出了个HMM的文章。最近看Feature selection,您就出了这一篇。。
偶尔看到这篇blog。其实并不需要用复杂的推导来计算,constraint和objective function之间这样的关系是convex optimization中典型的duality,L1 constraint相当于是这种一般情况的特例,类比而言,L2 constraint也有这样的性质。
恩,目的是想把 explicit formula 写出来(虽然最后得到的关系其实完全不 explicit)。所谓推导其实也都是重复了一下凸优化里的内容了。
楼主的公式渲染挺不错,看了下网页源代码,好像是用的MathJax,这货设置起来复杂么?
用wordpress的话就是后台装个插件的事儿……
我把blog放在github pages上......不过看了看它的getting started文档,感觉挺简单的,设置一下js就可以了,有时间折腾下~~
最近Github+markdown做博客好像很流行的样子。。
我不用markdown,我用org mode。。 >_<
不明觉厉!
不复杂,基本上 html header 加一条语句就可以了。
嗯,看了下文档,确实挺简单,近期折腾下。。
楼主好牛啊!@
博主好。关于这篇博文我想请教:第一个问题:您的证明中用到了“凸优化解的唯一性”,我记忆中是:严格凸问题有唯一(全局)解;仅仅是凸的话,只能保证全局解的存在性但全局解可能不唯一。这里讨论的三个问题,显然都不是严格凸的(Hessian阵半正定)。这个困惑求解释。第二个问题:文中提到lambda、epsilon和t之间的关系是一一对应,这个结论有论文明确地提出来过(有严格证明更好)吗?如果有,能否给个链接?第一个问题让我有点怀疑给出的对应关系(是对的)是否是映射。。。
L2 norm 是严格凸的啊,而且 L1 norm 不可微,不知道你如何得出 Hessian 阵半正定的结论的?
好,我解释下。(1/2)||Ax-b||^2_2求二阶导:transpose(A)*A(Hessian),因为A是overcomplete,所以存在非零向量x,使得Ax=0,这样transpose(A)*A半正定(这里要说抱歉:我指的Hessian阵半正定是这一部分。);对于1范数,确如博主所言,在零分量不可微,那我们从严格凸的定义解释:举个反例:x_1=transpose([0,0,...,0]),x2=transpose([5,5,...,5]),for every a in (0,1),||(1-a)x1+ax2||_1=(1-a)||x1||_1+a||x2||。
你好,不好意思,你说得没错。||Ax-b||^2 确实当 A overcomplete 的时候 Hessian 半正定的。严格凸能够保证解的唯一性,但是非严格凸并不一定就会解不唯一。当然对于这里来说还是有可能出问题的,如果 Ax - b = 0 定义的 affine 子空间和 L1-ball 的边界平行了的话,确实就解不唯一了,这一点之前都没有考虑过。
对于文中给的证明的话,一方面是求当两个问题的解相等的时候他们对应的参数 lambda、t 之类的满足什么样的关系。这个方向应该是没有问题的,即使有多个解也可以。但是反过来证明当 lambda、t 满足某个关系的时候最优解相等就必须要用到解的唯一性了,这里就比较有问题了。也许还是有一定的“对应关系的”,就是一边的解空间里的一个元素会有另一边有一个解对应起来。
另外就是 A 是 overcomplete 的情况经常会出现在 Compressive Sensing 相关的问题里,不过 CS 里研究的情况都是要求 A 满足一定的性质,此时必须要得出文中的第二个问题的解是唯一的。我想在这样的情况下应该也可以推出其他两个问题在这样的条件下解也是唯一的。
至于文献的问题,我在查找资料的时候看到的大都是随便提一句或者零零散散有一点相关的证明,并没有看到专门把这个提出来仔细讲的文章,不好意思。
非严格凸确实不一定解不唯一,可以举出反例来。对于文中的三个问题来说,解确实不唯一,我想这是A的零空间非空所决定的。
我猜想lambda、epsilon、t之间的一一对应关系是成立的。只是需要更严格(甚至更复杂)的证明。
CS中往往假设A的列取自某个分布,这种情况下解的唯一性可能以概率1成立。
虽然博文的分析并不完善,但博主讨论的话题(包括其它博文)确实很有意思也很有意义,读过后引发很多思考,就直接写在评论里希望和博主讨论。谢谢博主的长回复,这个问题我想我还会继续思考下去。
谢谢,如果发现/想到什么比较完善的结果也请告知一下。
博主,你好强大的说。有没有关于l0等价性的证明或者相关结论呢?
l0 和 l1 在一些前提下的等价性可以参见 Compressive Sensing 相关的内容。
你好,是l0各模型之间的等价性,不是l0和l1之间的。
------------------ 原始邮件 ------------------
发件人: "Disqus";<notifications@disqus.net>;
发送时间: 2013年11月25日(星期一) 晚上9:46
收件人: "Amsterdam学院大学联"<459857767@qq.com>;
主题: Re: New comment posted on Equivalence of Several L1 Sparsity Problem
Settings
A new comment was posted on Free Mind
pluskid
l0 和 l1 在一些前提下的等价性可以参见 Compressive Sensing 相关的内容。
8:46 a.m., Monday Nov. 25
Reply to pluskid
pluskid’s comment is in reply to lemon:
博主,你好强大的说。有没有关于l0等价性的证明或者相关结论呢?
Read more
You're receiving this message because you're signed up to receive notifications about replies to disqus_sywwrYZcr6.
You can unsubscribe from emails about replies to disqus_sywwrYZcr6 by replying to this email with "unsubscribe" or reduce the rate with which these emails are sent by adjusting your notification settings.
博主你好,在推导URLS问题和LASSO问题的逆向 映射时,用到下面这个公式,针对每一个不为0的分量,都可以解出一个lambda,但是lambda的值只能有一个,这不就等于要求最优解只能有一个非零项吗?这样的要求不合理呀!
不同的非零项可以解出相等的 lambda 啊。
博主,怎么得到lambda的那个表达式呢?你直接就得到了,我怎么看不懂啊?为什么满足URLS问题的解的最优性条件的lambda是那个形式呢?我推不出来刚才发给你的那个有关lambda的公式。
------------------ 原始邮件 ------------------
发件人: "Disqus";<notifications@disqus.net>;
发送时间: 2013年12月2日(星期一) 晚上9:27
收件人: "Amsterdam学院大学联"<459857767@qq.com>;
主题: Re: New comment posted on Equivalence of Several L1 Sparsity Problem
Settings
A new comment was posted on Free Mind
pluskid
不同的非零项可以解出相等的 lambda 啊。
8:27 a.m., Monday Dec. 2
Reply to pluskid
pluskid’s comment is in reply to lemon:
博主你好,在推导URLS问题和LASSO问题的逆向 映射时,用到下面这个公式,针对每一个不为0的分量,都可以解出一个lambda,但是lambda的值只能有一个,这不就等于要求最优解只能有一个非零项吗?这样的要求不合理呀!
Read more
You're receiving this message because you're signed up to receive notifications about replies to disqus_sywwrYZcr6.
You can unsubscribe from emails about replies to disqus_sywwrYZcr6 by replying to this email with "unsubscribe" or reduce the rate with which these emails are sent by adjusting your notification settings.
博主你好,关于这篇文章,我想和你进行深入探讨,不知道你有兴趣吗?我认为证明中存在一些瑕疵,有可能导致结论的正确性,我很有兴趣和你探讨他们之间的等价性结论,并希望能够完善这个证明。
------------------ 原始邮件 ------------------
发件人: "Disqus";<notifications@disqus.net>;
发送时间: 2013年12月2日(星期一) 晚上9:27
收件人: "Amsterdam学院大学联"<459857767@qq.com>;
主题: Re: New comment posted on Equivalence of Several L1 Sparsity Problem
Settings
A new comment was posted on Free Mind
pluskid
不同的非零项可以解出相等的 lambda 啊。
8:27 a.m., Monday Dec. 2
Reply to pluskid
pluskid’s comment is in reply to lemon:
博主你好,在推导URLS问题和LASSO问题的逆向 映射时,用到下面这个公式,针对每一个不为0的分量,都可以解出一个lambda,但是lambda的值只能有一个,这不就等于要求最优解只能有一个非零项吗?这样的要求不合理呀!
Read more
You're receiving this message because you're signed up to receive notifications about replies to disqus_sywwrYZcr6.
You can unsubscribe from emails about replies to disqus_sywwrYZcr6 by replying to this email with "unsubscribe" or reduce the rate with which these emails are sent by adjusting your notification settings.
你好,如果你想要通过邮件讨论的话,可以直接给我发邮件。这样直接回复邮件 disqus 把一大堆 quote 全部都贴在评论里了。
博主,您好!
对于等价的推导,我有个很基本的疑问:如何描述这几种稀疏优化问题的等价性?具体说,就是当我们说URLS和LASSO问题等价时,充分和必要条件分别是什么?
对等价性,我有这样两种理解:URLS的最优解也是LASSO问题的最优解,反之亦成立;另一种,就是两种问题可以相互转化。
博主的文中对上述两方面似乎都谈到了,但我没太理清楚证明逻辑是怎样的。希望得到您的解答,谢谢!
你好,URLS 和 LASSO 问题都有各自的参数,当参数匹配上的时候两个对应的问题“等价”,他们之间的解关联起来。
博主,您好。这里面的指的是什么?好像没什么上下文就直接蹦出来了。
博主,您好。请问下图红色方框内的符号代表什么,好像没什么上下文就突然出现了。
哦,看明白了,分别表示a和c情况下的最优解